备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC支持断点续传吗，有没有示例？

Flink CDC支持断点续传吗，有没有示例？

展开

收起

真的很搞笑 2023-11-01 14:24:33 714 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

4 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Flink CDC确实支持断点续传。以下是使用Flink CDC实现断点续传的基本步骤：
1. 启用检查点
要启用Flink CDC的断点续传功能，首先需要启用检查点。可以通过调用env.enableCheckpointing(interval)方法来启用检查点，其中interval参数表示检查点间隔时间。
1. 设置检查点模式
为了确保数据的正确性，需要将检查点模式设置为EXACTLY_ONCE。可以通过调用env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE)方法来实现这一目标。
1. 设置任务关闭时保留最后一次检查点数据
为了能够在任务失败或停止时从最后一个检查点恢复数据，需要设置任务关闭时保留最后一次检查点数据。可以通过调用env.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION)方法来实现这一目标。
1. 设置从检查点自动重启策略
为了确保任务能够从上次成功完成的检查点自动恢复，需要设置从检查点自动重启策略。可以通过调用env.getCheckpointConfig().enableAutomatic checkpoints()方法来实现这一目标。
1. 启动Flink CDC任务
最后，可以使用StreamExecutionEnvironment.executeJob(name, inputDStream)方法来启动Flink CDC任务，其中name参数表示任务名称，inputDStream参数表示Flink CDC的输入数据流。
2023-11-02 22:42:10

赞同展开评论
sunrr

Flink CDC支持断点续传功能，这需要在Flink CDC的配置文件中进行相应的设置。

2023-11-02 14:57:08

赞同展开评论

穿过生命散发芬芳

支持。

给当前的 Flink 程序创建 Savepoint：

bin/flink savepoint JobId hdfs://hadoop102:8020/flink/save

关闭程序以后从 Savepoint 重启程序：

bin/flink run -s hdfs://hadoop102:8020/flink/save/... -c 全类名 flink-1.0-SNAPSHOT-jar-with-dependencies.jar

2023-11-02 00:58:39

赞同展开评论

芯在这

支持，bonlog个和偏移量，此回答整理自钉群“Flink CDC 社区”

2023-11-01 21:27:51

赞同 1 展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版断点续传实时计算 Flink版cdc示例实时计算 Flink版cdc断点续传

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC里使用3.0的版本 flink1.18版本报错怎么办？

261

0

0

flink接入Kafka断点续传问题

228

1

0

Flink batch 模式下实现多路多分片读有示例么？

105

0

0

Flink storageDir 这个配置 s3 协议有人用过吗？能发给示例参考下吗？

123

0

0

Flink这个示例的分组边界是怎么定义的呢？

100

1

0

Flink CDC 任务报错崩掉如何实现断点续传的功能呢？

200

1

0

Flink CDC里整库同步支持mysql->kafka吗？这个有示例吗？

118

1

0

Flink有批处理FlinkSQL的示例吗？带有这种指定时间参数的。官方文档上我找了一圈没找到

122

0

0

Flink CDC里我现在想postgresql 能实时入库 hive，并且能实现断点续传，怎么办？

191

2

0

在Flink CDC项目中，我正在使用Flink PostgreSQL CDC功能是否支持断点续传？

209

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

OOM排查之路：一次曲折的线上故障复盘

OOM排查之路：一次曲折的线上故障复盘

非精准 Top K 检索如何实现？

数据管道别裸奔！聊聊单元、集成、端到端测试的“三层护体”玩法

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

flink cdc同步的源表，一定要有主键么？

flink cdc source端能降低消费速度嘛？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

Flink CDC写 PG，列为数组，为什么？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?