文档备案控制台

开发者社区问答正文

Flink 中的分布式快照机制是怎么实现的？

Flink 中的分布式快照机制是怎么实现的？

展开

收起

芯在这 2021-12-09 17:02:03 595 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

Flink的容错机制的核心部分是制作分布式数据流和操作算子状态的一致性快照。这些快照充当一致性checkpoint，系统可以在发生故障时回滚。 Flink用于制作这些快照的机制在“分布式数据流的轻量级异步快照”中进行了描述。它受到分布式快照的标准Chandy-Lamport算法的启发，专门针对Flink的执行模型而定制。

barriers在数据流源处被注入并行数据流中。快照n的barriers被插入的位置（我们称之为Sn）是快照所包含的数据在数据源中最大位置。例如，在Apache Kafka中，此位置将是分区中最后一条记录的偏移量。将该位置Sn报告给checkpoint协调器（Flink的JobManager）。

然后barriers向下游流动。当一个中间操作算子从其所有输入流中收到快照n的barriers时，它会为快照n发出barriers进入其所有输出流中。一旦sink操作算子（流式DAG的末端）从其所有输入流接收到barriers n，它就向checkpoint协调器确认快照n完成。在所有sink确认快照后，意味快照着已完成。

一旦完成快照n，job将永远不再向数据源请求Sn之前的记录，因为此时这些记录（及其后续记录）将已经通过整个数据流拓扑，也即是已经被处理结束。

2021-12-09 17:02:23

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版分布式 flink分布式实时计算 Flink版快照分布式flink 实时计算 Flink版机制

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink-CDC 2.4.0版本增量快照模式不生效

390

1

0

分布式锁提供Fencing保护的核心机制是什么？

173

1

0

分布式锁的内部实现机制是怎样的？

113

1

0

简述 PolarDB-X 实现分布式事务全局一致性和快照隔离的流程？

217

1

0

flink-cdc支持 postgre的增量快照吗？

299

1

0

在 Flink 机制中，DFS 如何帮助实现 DSTL 的短期持久化和一致性保证？

196

1

0

Flink中通过MQ的连接器消费数据时有确认机制吗？

425

2

0

Flink CDC 2.2 版本支持哪些新数据源，兼容哪些 Flink 版本，提供了什么增量快照读取

352

1

0

为什么选择使用基于zk的分布式锁替换Hive Metastore的默认锁机制？

179

1

0

在Flink CDC中，快照阶段也需要记录binlog的？

254

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云服务器多少钱一年？价格贵不贵？有优惠吗？

总是提示您已达到配额使用上限，请升级订阅计划，以获得更多使用资源。问题反馈。但已经购买了资源

新人遇到两个问题，关于使用和白嫖

Qoder的搜索/索引进程rg.exe占满CPU

秒悟Meoo官网登录入口在哪？

相关文章

阿里云Kafka一键入湖技术详解：Iceberg+OSS Table Bucket落地方案

阿里云检索分析服务Elasticsearch版对接使用全攻略

专访｜GEO落地工程师罗长才：解析GEO与低时延通信、算网基础设施的协同赋能逻辑

阿里云表格存储Tablestore对接使用完全指南：从入门到实战

别等用户跑路才报警！大数据风控，真正拼的是“毫秒级判断”

还有其他疑问?