文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC如果中间结果集状态过大几百m的情况下，失败的是否是全量检查点？

Flink CDC如果中间结果集状态过大几百m的情况下，我设置了官网给出的100次restart-fixed，这时候用的rocksdb后段。我看check point其中有部分成功了部分失败了，那么下次再进行检查点设置时成功的是否为增量检查点，失败的是否是全量检查点？现在非常不稳定，因为checkpoint失败导致的全量数据刷新，如何能做到大状态高可用的检查点？增量检查点如果第一次失败了那么下一次是否是执行上一次的检查点，还是执行当前最新的检查点？就忽略了上次的失败？总检查点展开我可以看到会为每个执行计划生成检查点，如果总检查点失败，但是子检查点部分成功，那么下次总检查点时无需执行成功过的检查点吧

展开

收起

真的很搞笑 2023-12-05 20:36:49 279 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Flink CDC的检查点机制是其实现容错机制的核心功能，通过周期性地基于数据流中各个操作符的状态生成快照，将这些状态数据定期持久化存储下来。这样，当Flink程序因意外崩溃时，可以依靠这些检查点恢复流中的状态和位置，从而提供与无故障执行相同的语义。

对于大状态应用，Flink提供了一些优化策略来保证检查点的可靠性。首先，应用程序需要能够可靠地创建检查点。其次，发生故障后，作业的处理速度要能赶上输入数据流。同时，Flink支持高级的状态后端（State Backends），允许存取海量的状态数据。

关于你的问题：
1. 增量检查点和全量检查点的概念是相对的，取决于上一次成功的检查点和当前状态的差异。如果第一次失败了那么下一次会执行最新的检查点，而不会忽略上次的失败。
2. 如果总检查点失败，但是子检查点部分成功，那么下次总检查点时无需执行成功过的检查点。
3. 关于RocksDB后端的使用，你提到有些检查点成功了有些失败了，这可能与配置有关。你可以尝试调整相关参数以优化结果。
2023-12-06 14:40:25

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版cdc检查实时计算 Flink版检查实时计算 Flink版全量实时计算 Flink版全量检查

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink cdc 3.0支持手动savepoint，然后从停止job，然后从检查点启动job吗

319

0

0

Flink默认先全量再增量同步，全量时会对checkpoint上锁，导致请求检查点时失败，任务重启

553

1

0

Flink1.19.1 S3（minio）保存检查点报错

826

1

0

Flink CDC 读取mysq出现问题从检查点重启这个flinkcdc任务也不行，如何解决问题？

364

1

0

在Flink CDC中，全量同步是遇到什么问题了吗？

178

1

0

在Flink CDC中，有遇到此报错吗？将检查点写入到oss，启动job报错。

222

0

0

在Flink CDC中作业异常以后，会自动从检查点恢复作业，但是为什么一直恢复失败?

150

0

0

任务可以通过深度检查部署成功，但是启动会ddl超时默认的600s，Flink这个参数在哪里设置？

193

0

0

Flink CDC无法从检查点恢复，是因为开增量检查点的原因吗？

181

0

0

flink cdc 任务重启，读取新增的表数据不全，没有读取到全量数据

390

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

告别干扰困扰！RFID手持机在复杂仓储中的可靠表现

分链路差异化设计的DSP准实时数仓｜钛动科技基于阿里云实时计算 Flink 版 + DLF Paimon + EMR Serverless StarRocks 的实践

Arduino IDE下载安装和汉化一篇搞定（2026最新）

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

Hologres + Flink 实时OLAP分析实战：从T+1报表到秒级洞察的数据平台

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC 能适配达梦不？

Segment Key主要应用在哪些场景？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有人遇到flink打不开web界面吗？

Apache Flink未授权访问上传导致的RCE漏洞，这个漏洞目前方案解决吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

广告场景下的实时计算

展开全部

还有其他疑问?