文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

我用的Flink1.7,CDC版本2.3的，有没有的类似代码给一个，看看是不是哪里配置少了？

我用的Flink1.7,CDC版本2.3的，这种initial模式理论上是第一次同步全量数据，后面如果再启动，只要flink保存了checkpoint，里面应该有程序停止前的scn位置吧，下次启动不会再全量读了，从上次的scn开始读，有没有的类似代码给一个，看看是不是哪里配置少了？

展开

收起

真的很搞笑 2023-11-06 19:58:24 158 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

sunrr

对不起，我之前的回答可能有误。Flink CDC的Initial Mode确实是在启动时会进行一次全量同步，无论是否有Checkpoint。这是因为Initial Mode的设计目标就是一次性地将所有的数据加载到State中，以便后续的增量处理。

如果你希望在后续的启动中能够从上次停止的地方继续读取，你可能需要使用Flink CDC的Incremental Mode。在Incremental Mode中，Flink CDC会根据Checkpoint中的位置信息，从上次停止的地方继续读取。

然而，Flink CDC的Incremental Mode目前只支持MySQL和PostgreSQL，对于Oracle的支持还在开发中。此外，Incremental Mode的使用也需要一些额外的配置，例如需要设置TableSchemaHistoryRetentionTime，以便Flink CDC知道从哪里开始读取。

对于你的需求，我建议你可以考虑使用Flink CDC的Incremental Mode，并在启动任务之前，手动地将Checkpoint中的位置信息设置为上次停止的地方。这样，你就可以实现在后续的启动中能够从上次停止的地方继续读取的目标。

2023-11-07 11:30:55

赞同 1 展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版代码实时计算 Flink版版本实时计算 Flink版cdc版本实时计算 Flink版配置

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC 里NameNode切换active/standby，导致代码报错，有办法避免吗？

122

1

0

这个代码flink 1.5可以调用 jars/upload上传jar包。啥情况？

416

1

0

Flink CDC监控mysql，如果源端表的结构发生变化，还是需要用户自己代码实现？

231

1

0

Flink CDC中demo这边也取消注释代码了，但还是未按预期打印变更的SQL？

155

1

0

Flink我本地代码有这个配置程序就卡住了，这个属于正常现象么？

130

0

0

对于Flink CDC，是否可以贡献tidb的source代码？

145

1

0

在Flink CDC中MYSQL cdc ds代码开发通过正则的方式获取数据，这个正则格式怎么写？

118

0

0

Flink的SQL代码只能查看不能编辑

97

1

0

Flink的jar包方式同步数据，代码里面还需不需要定义存储oss位置？

99

1

0

Flink CDC3.1中把代码复制到3.0.1然后重新打个mysql-pipeline包该如何操作

144

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

文本字符数统计在线工具核心JS实现

什么是批处理？一文搞清批处理和流处理的区别

个人所得税计算器在线工具分享

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Dataphin功能Tips系列（95）如何自定义Dataphin告警消息

相关解决方案

更多

零代码微调，打造领域专属大模型

Flink CDC 实现企业级实时数据同步

零代码搭建 DeepSeek 版个人知识库

零代码搭建企业级图像与视频创作平台

企业多账号配置统一合规审计

热门讨论

热门文章

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

Flink有2023 Flink Forward Asia 资料下载地址吗?

flinkcdc在IDEA运行正常，打包就报错

有用flink cdc同步mysql到hive这样搞过的源码吗?

Flink1.10 python API 对流式处理的支持度如何，能直接用于生产吗？

在Flink CDC中，直接将我生成的application会话kill掉了,有人遇到过吗？

这个不显示数据，大家怎么处理的

大佬们，请教下，Flink CDC2.4.0版本的mysql cdc，怎么设置时区"？

展开全部

Apache Flink 漫谈系列(04) - State

携程实时智能检测平台建设实践

Flink 基础详解：大数据处理的强大引擎

Flink CDC+Kafka 加速业务实时化

实时计算 Flink版产品使用合集之支持 MySQL 的并行复制吗

Apache Paimon统一大数据湖存储底座

数据仓库介绍与实时数仓案例

Flink CDC：基于 Apache Flink 的流式数据集成框架

Flink Agents：基于Apache Flink的事件驱动AI智能体框架

实时计算 Flink版产品使用合集之怎么将MyBatis-Plus集成到SQL语法中

展开全部

还有其他疑问?