文档备案控制台

开发者社区问答正文

在并发度大且有 shuffle的作业中，为什么会出现RPC超时和JobMaster上大量请求的情况？

在并发度大且有 shuffle 的作业中，为什么会出现 RPC 超时和 JobMaster 上大量 requestPartitionState 请求的情况？

展开

收起

夹心789 2024-07-30 16:37:30 203 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

呆呆宝

在并发度大且有 shuffle 的作业中，下游 Task 启动时会检查上游 Task 的 partition 是否就绪。如果上游 Task 还未就绪，下游 Task 会频繁请求 JobMaster 去询问上游 Task 的状态，导致 JobMaster 上出现大量的 requestPartitionState 请求。这种频繁的请求在作业规模很大时，很容易导致 RPC 超时。

2024-07-30 19:38:24

赞同展开评论

问答标签：

RPC超时作业RPC

问答地址：

开发者社区 > 云计算 > 问答

相关问答

请问seata中，seata rpc timeout 跟feign的超时机制设置时长有没有关系？

1136

3

0

你们是如何解决下游 Task 频繁请求 JobMaster 导致 RPC 超时的问题的？

208

1

0

Nacos 两个java应用进行rpc v2通讯，a应用对b应用通讯超时报错，导致业务异常了？

222

0

0

mPaaS使用移动网关，客户端（安卓）发起的rpc请求可以用抓包工具看到请求的参数吗？

351

1

0

在Seata中请问下客户端日志这边报RPC timeout，这是哪个环节超时？

413

0

0

客户端在构建RPC请求时需要设置哪些关键信息？

145

1

0

阿里云RPA这个rpc请求失败是啥问题啊？

702

3

0

请问阿里云RPA这个是什么错误？Rpc请求失败

242

1

0

阿里云OpenAPI使用rpc调用的时候，如果将参数直接放在请求体中是不是就不需要进行编码了？

203

2

0

seata 开启全局事务rpc通讯超时怎么办？

1608

19

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

什么时候支持本地模型呢？

Qoder 还有Qoderwork都无法添加第三方模型

Qoder 使用体验极差优化！

你们的管理混乱，太垃圾了。

还有其他疑问?