备案控制台

开发者社区问答正文

实时计算Flink中，任务反压会造成什么影响？

已解决

实时计算Flink中，任务反压会造成什么影响？

展开

收起

詹姆斯邦德00 2022-10-17 11:15:45 535 版权

来自：开发者社区官方技术圈

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

胡嘞嘞

推荐回答

一般任务的反压并不会直接影响实时任务，但是任务中反压的节点是处于一个高负载情况，会造成任务的延迟越来越大，如果是持续性的反压，意味着任务本身存在瓶颈，可能导致潜在的不稳定或者数据延迟，尤其是数据量较大的场景下，反压的影响主要体现在Flink中checkpoint生成上，主要影响两个方面：

•任务出现反压，上游数据流阻塞，会使数据管道中数据处理速度变慢，数据处理被阻塞也会导致 checkpoint barrier 流经整个数据管道的时长变长，因而 checkpoint总体时间（End to End Duration）变长甚至是checkpoint失败。

•因为为保证 EOS（Exactly-Once-Semantics，准确一次），在对齐checkpoint场景中，算子接收多个管道输入，输入较快的管道数据state会被缓存起来，等待输入较慢的管道数据barrier对齐，这样由于输入较快管道数据没被处理，反压一直存在，较快的数据进入后一直积压可能导致OOM或者内存资源耗尽的不稳定问题。

这个影响对于数据量大的生产环境的作业来说是十分危险的，因为 checkpoint是保证数据一致性的关键，checkpoint 时间变长有可能导致 checkpoint 超时失败，而 state 大小同样可能拖慢 checkpoint 甚至导致 OOM 从而导致实时任务异常，而且不能能失败的checkpoint进行快速恢复。

以上内容摘自《企业级云原生白皮书项目实战》电子书，点击https://developer.aliyun.com/ebook/download/7774可下载完整版

2022-10-17 19:16:49

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版任务反压

问答地址：

开发者社区 > 开发者社区官方技术圈 > 问答

相关问答

Flink CDC这种反压怎么处理呀？

227

1

0

Flink CDC读取数据有限流的配置么，发现cdc读取太快，sink慢导致反压了，不知道咋解决了？

140

1

0

Flink CDC中sqlserver--->sqlserver。反压严重，大家有啥好办法不？

172

2

0

Flink CDC读取数据有限流的配置么，发现cdc读取太快，sink慢导致反压了？

370

1

0

Flink CDC全量阶段这种反压情况会是什么原因呢？

295

3

0

Flink CDC有遇到过kafka实时同步hudi出现反压的情况吗？

205

1

0

Flink任务的checkpoint生成时间用了2分多钟是正常的么？出现反压

109

1

0

如何处理flink反压？

120

1

0

如何通过监控来定位和处理Flink作业中的反压问题？

183

1

0

Flink从哪里能看反压堵塞多长时间？

102

1

0

收录在圈子:

开发者社区官方技术圈

70138

+ 订阅

阿里云开发者社区官方技术圈，用户产品功能发布、用户反馈收集等。

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

notebook启动安全验证一直失败

通义灵码的idea插件，在Mac系统下，idea版本2025.3.1，idea打开通义灵码插件花屏

运行qwen-image显示Reconnecting

macos 下 lingma 编辑AI 对话栏问题

创业项目：AI 拟人化中层解决方案

相关文章

克服Flink SQL限制的混合API方法

别被“结构化”骗了：聊聊 Spark Structured Streaming 的原理与那些年我踩过的坑

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

数据同步工具选型：DataMover、DataX、Kettle、ETLCloud、Talend、Airbyte

流处理跑得再快，也怕“失忆” ——聊聊 RocksDB、快照与恢复这点事儿

还有其他疑问?