备案控制台

开发者社区问答正文

请教关于是否有除了计算压力以外的反压原因

如题，反压的原因，不考虑计算压力大，并行度不合理等问题。比如是否可能和网络也有关呢？考虑如下case，A->B->C这么一个拓扑，我A（source）结点反压100%，数据彻底不再发送，但B和C都不反压。但是B、C都是非常简单（不可能存在性能问题）。那这还有什么解释吗？

比如，A和B之间网络是否可能出问题呢？

此外，从机器cpu等监控来看，出现反压后，cpu idle提升，即反压到cpu利用率直接降低，且cpu在附近实际无升高的迹象。因此不会是瞬间有压力来导致反压。我当前怀疑和网络有关，有人知道如何确认吗。这种case是否有可能自动恢复呢。

我最近貌似遇到过好几次类似的case，就是反压到直接不发送数据，整个任务彻底停滞。最终解决方式：1 停任务（而且每次停任务都会有1个task长期处于canceling最终导致tm失败） 2 停ok并且重启tm后，重启任务。任务运行恢复正常。

从如上来看，也更进一步证明了不是压力问题，否则为什么我重启就没问题了。不重启则是“一直”反压停滞。*来自志愿者整理的flink邮件归档

展开

收起

毛毛虫雨 2021-12-08 11:28:36 819 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

雪哥哥

我比较倾向于是网络原因。但flink的日志目前无法很明显反映和确认。期望有人从flink反压机制角度考虑下，有没有因为网络“抖动”，比如长连接断开等问题导致反压的case。而且这种情况是否会自动恢复呢？*来自志愿者整理的flink邮件归档

2021-12-08 16:19:37

赞同展开评论

问答分类：

监控流计算实时计算 Flink版

问答地址：

开发者社区 > 大数据 > 问答

相关问答

this xml file does not appear to have any style in

49580

10

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

128872

28

0

请问下我访问接口不通什么原因 Provisional headers are shown

2401

0

0

购买阿里国外的云服务器是否可以访问谷歌？

81485

47

0

手机弹出支付风险问题

6552

2

0

OSS的endpoint如何查看

36652

6

0

配置了安全组规则，端口还是无法访问

32591

25

0

sql server的用户名和密码怎么查啊？

36080

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

59872

30

0

计算机网络的频带传输是什么意思？

1688

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云短信服务工程师连我方发送记录只会收阿里云错误码都不知道吗？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

我就想把本地的 vm 虚拟机迁移到 ECS，整的这些文档又臭又长，有这精力你录个视频不行吗？

为什么现在连qwen3-coder 之类的模型都不能选了，就一个智能回答？

biz.util.invokeWorkbench这个api打开窗口方式变了

相关文章

Flink CDC 3.5 正式发布，新增 PostgreSQL Source 和 Fluss Sink 连接器

Python文件操作全攻略：从基础到高级实战

日志服务&云监控全新发布，共筑企业智能运维新范式

从0到1了解京东商品详情api

《3D游戏动作交互优化：剑舞穿模与落地延迟的解决策略》

还有其他疑问?