文档备案控制台

开发者社区问答正文

Flink中的调度策略及容错具体是什么？

Flink中的调度策略及容错具体是什么？

展开

收起

游客vwuxaq6iqaowc 2021-12-09 16:19:11 651 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客hveo756ydhs3k

众所周知，批处理作业和流处理作业在 Task 调度上是很不同的。批处理作业的多个 Task 并不需要同时在线，可以根据依赖关系先调度一批 Task，等它们结束后再运行另一批。相反地，流作业的所有 Task 需要在作业启动的时候就全部被调度，然后才可以开始处理数据。前一种调度策略通常称为懒调度（Lazy Scheduling），后一种通常称为激进调度（Eager Scheduling）。为了实现流批一体，Flink 需要在 StreamGraph 中同时支持这两种调度模式，也就是说新增懒调度。

随调度而来的问题还有容错，这并不难理解，因为 Task 出现错误后需要重新调度来恢复。而懒调度的一大特点是，Task 计算的中间结果需要保存在某个高可用的存储中，然后下个 Task 启动后才能去获取。而在 1.9 版本以前，Flink 并没有持久化中间结果。这就导致了如果该 TaskManager 崩溃，中间结果会丢失，整个作业需要从头读取数据或者从 checkpoint 来恢复。这对于实时流处理来说是很正常的，然而批处理作业并没有 checkpoint 这个概念，批处理通常依赖中间结果的持久化来减小需要重算的 Task 范围，因此 Flink 社区引入了可插拔的 Shuffle Service 来提供 Suffle 数据的持久化以支持细粒度的容错恢复

2021-12-09 16:19:24

赞同展开评论

问答分类：

调度流计算实时计算 Flink版

问答标签：

实时计算 Flink版容错实时计算 Flink版调度实时计算 Flink版策略实时计算 Flink版调度策略

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink作业重启策略如何配置

197

1

0

Flink这个调度超过23h之后全都无法保存，为什么？

113

1

0

在Flink CDC中,cdc怎么配置重启策略啊？

193

1

0

Flink容错架构的核心是什么？

103

1

0

如何将 Flink 的容错与云原生的弹性扩缩容相结合？

129

1

0

影响 Flink 容错的因素有哪些？

109

1

0

容错在 Flink 中为什么重要？

94

1

0

在 Flink 容错 2.0 中，从调度的角度有哪些改进？

69

1

0

Flink 如何通过云原生技术改进容错设计？

103

1

0

Flink 在容错恢复时面临的主要挑战是什么？

81

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云如何部署使用OpenClaw？OpenClaw部署一看就会：零基础零代码、纯点击

阿里云ECS 手动部署 OpenClaw 超详细教程（2026最新版）

2026年阿里云新老用户如何部署OpenClaw？OpenClaw部署喂饭级教程

在今天3点左右通义灵码问问题不正常返回了

2026年阿里云一键部署OpenClaw(Clawdbot)成功，怎么接入QQ、钉钉、微信、飞书

相关文章

9B 上端侧：多模态实时对话，难点其实在“流”

蓝易云：CDN海外加速的有效方法_打破地域限制!加速海外访问

Seedance是什么？能做什么？与OpenClaw深度解析：功能定位、应用场景及核心区别+阿里云OpenClaw部署实操

阿里云OpenClaw多Agent实战宝典：从极速部署到AI团队搭建，一个人=一支高效军团

过完年AI世界全变了！老金帮你5分钟看完春节13个重磅发布

还有其他疑问?