文档备案控制台

开发者社区问答正文

请教关于是否有除了计算压力以外的反压原因

如题，反压的原因，不考虑计算压力大，并行度不合理等问题。比如是否可能和网络也有关呢？考虑如下case，A->B->C这么一个拓扑，我A（source）结点反压100%，数据彻底不再发送，但B和C都不反压。但是B、C都是非常简单（不可能存在性能问题）。那这还有什么解释吗？

比如，A和B之间网络是否可能出问题呢？

此外，从机器cpu等监控来看，出现反压后，cpu idle提升，即反压到cpu利用率直接降低，且cpu在附近实际无升高的迹象。因此不会是瞬间有压力来导致反压。我当前怀疑和网络有关，有人知道如何确认吗。这种case是否有可能自动恢复呢。

我最近貌似遇到过好几次类似的case，就是反压到直接不发送数据，整个任务彻底停滞。最终解决方式：1 停任务（而且每次停任务都会有1个task长期处于canceling最终导致tm失败） 2 停ok并且重启tm后，重启任务。任务运行恢复正常。

从如上来看，也更进一步证明了不是压力问题，否则为什么我重启就没问题了。不重启则是“一直”反压停滞。*来自志愿者整理的flink邮件归档

展开

收起

毛毛虫雨 2021-12-08 11:28:36 842 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

雪哥哥

我比较倾向于是网络原因。但flink的日志目前无法很明显反映和确认。期望有人从flink反压机制角度考虑下，有没有因为网络“抖动”，比如长连接断开等问题导致反压的case。而且这种情况是否会自动恢复呢？*来自志愿者整理的flink邮件归档

2021-12-08 16:19:37

赞同展开评论

问答分类：

监控流计算实时计算 Flink版

问答地址：

开发者社区 > 大数据 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

85000

47

0

空间如何支持这些函数

33832

22

0

请问下我访问接口不通什么原因 Provisional headers are shown

4314

2

0

【阿里云运维部署工具AppDeploy详细教程】之4：应用部署

39491

6

0

阿里云服务器续费后一直处于启动中状态，服务器打不开了怎么解决？？？

36138

6

0

重启Docker后报错：Error response from daemon

2721

0

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

61435

32

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

128861

14

0

this xml file does not appear to have any style in

52535

10

0

如何加速中国访问美国云的服务器访问速度

31703

8

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

通义灵码提示格式问题

API inference endpoint都变成待机态了

modelscope 模型python调用

notebook启动安全验证一直失败

阿里云百炼大模型怎么收费？要钱吗？

相关文章

“熟人”私信藏杀机：LinkedIn钓鱼直击财务高管，企业社交平台成安全盲区

一封“2FA更新”邮件，险些让数亿开发者中招——NPM供应链钓鱼事件揭示开源生态的致命软肋

当“猎头私信”变成钓鱼入口：LinkedIn成企业安全新盲区，AitM攻击绕过MFA引发警报

大模型微调显存计算：从原理到实践的精准把控

低代码平台技术基础的结构特征与演进机制分析

还有其他疑问?