文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink这个启动状态恢复的机制是什么样的？

Flink这个启动状态恢复的机制是什么样的？请教大佬们一个问题，我使用checkpoint做状态恢复，任务里设置了configuration.set(SavepointConfigOptions.SAVEPOINT_PATH, file.getPath()，并且用了自己写的一个客户端以perjob模式提交到yarn上，发现我的状态没有恢复，isRestored是false
但是使用application模式提交的话是能正常读取我的状态的，后续我又测试了使用官方的flink-client提交，发现都可以正常读取状态。我debug源码发现JobGraph里有savepointRestoreSettings相关的配置，是在yarn-per-job模式提交代码必须有这个配置项吗？

展开

收起

三分钟热度的鱼 2023-08-22 20:43:23 219 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

Flink 的状态恢复是通过检查点实现的。检查点是 Flink 在运行时创建的快照，用于在 job 失败时恢复 job 的状态。当 job 失败时，Flink 会尝试从最近的检查点恢复 job 的状态。如果检查点不存在，Flink 会从历史记录中恢复 job 的状态。

Flink 的检查点机制有以下特点：

检查点是周期性创建的。
检查点是可选的。
检查点可以使用不同的策略进行管理。
Flink 的状态恢复机制有以下特点：

状态恢复是自动完成的。
状态恢复可以从最近的检查点或历史记录中进行。
状态恢复可以进行部分恢复。
Flink 的状态恢复机制可以保证 job 在失败后可以恢复到失败之前的状态。这使得 Flink 非常适合用于处理长时间运行的流处理任务。

2023-09-18 16:38:31

赞同展开评论

问答分类：

资源调度流计算实时计算 Flink版

问答标签：

实时计算 Flink版机制

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink cdc当sink开启多个parallel tasks后，是否考虑默认加一个机制？

276

1

0

Flink HA的机制很好，但在api-server出问题重启的时候会导致消耗次数，怎么办？

210

2

0

Flink CDC native on k8s ，使用了HA机制，大概发布了几百个任务？

524

1

0

我想测本地一下Flink CDC的checkpoint机制，能指点下这个大概哪里的问题么？

253

1

0

请教下 flink sql ROW_NUMBER()回退更新的机制，有相关文档介绍吗？

996

3

0

在 Flink 机制中，DFS 如何帮助实现 DSTL 的短期持久化和一致性保证？

196

1

0

Flink中通过MQ的连接器消费数据时有确认机制吗？

425

2

0

对于Flink CDC，有机制能在快照阶段结束后给外部系统发消息吗？

169

1

0

在Flink CDC中binlog 有读取锁的机制吗？

187

0

0

Flink状态机制是什么

145

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

企业出海如何构建高效稳定的数字化基础设施多平台协同管理实践解析

阿里云表格存储Tablestore对接使用完全指南：从入门到实战

别等用户跑路才报警！大数据风控，真正拼的是“毫秒级判断”

StarRocks x Fluss x Paimon 湖流一体方案：构建秒级响应、湖流一体的实时数据引擎

为什么你的物联网平台总是“掉链子”？真正的问题，不是设备，而是数据平台！

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC里这个问题怎么解决？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

如何用实时数据同步打破企业数据孤岛？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

展开全部

还有其他疑问?