文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC消费kafka的时候使用latest，用savepoint启动后不生效？

Flink CDC消费kafka的时候使用latest，用savepoint启动后不生效，中间的数据都漏掉了，这个有办法解决吗？

展开

收起

真的很搞笑 2023-09-28 12:01:34 382 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

Flink CDC消费kafka的时候使用latest，用savepoint启动后是不生效的。

Flink CDC的latest模式，会从kafka中获取最新的一条数据，然后一直从这个位置开始读取数据。如果使用savepoint启动，那么Flink会从savepoint中恢复状态，并从该状态开始读取数据。如果savepoint中保存的状态是之前的某个时刻，那么Flink CDC就会从该时刻开始读数据，而不会从最新的数据开始读取。

为了解决这个问题，可以使用Flink CDC的timestamp模式。timestamp模式会从kafka中获取最新的一条数据，然后从该数据的timestamp开始读取数据。这样，即使使用savepoint启动，Flink CDC也会从最新的数据开始读取。

另外，也可以使用Flink CDC的offset模式。offset模式会从kafka中获取最新的offset，然后从该offset开始读取数据。这样，即使使用savepoint启动，Flink CDC也会从最新的offset开始读取。

在Flink CDC中，timestamp模式和offset模式都可以实现从最新的数据开始读取数据。但是，timestamp模式需要手动设置timestamp，而offset模式不需要。因此，对于大多数用户来说，offset模式会更加方便。

2023-10-17 10:06:01

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

实时计算 Flink版savepoint 实时计算 Flink版kafka savepoint 实时计算 Flink版cdc kafka savepoint 云消息队列 Kafka 版latest savepoint

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2328

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1955

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1477

2

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

6513

18

0

Flink Savepoint与Checkpoint的区别

382

1

0

Flink请教大家一个问题： savepoint 和 checkpoint恢复有什么区别呀？

495

2

0

FLINK异常重启的时候，自动选择的快照文件，是savepoint目录的还是checkpoint目录

632

1

0

flink savepoint checkpoint

1529

1

0

flink savepoint和checkpoint相关事项

619

1

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

2194

3

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

AI工作流结果已保存、下游事件却没发出去怎么办？用Outbox模式补上事务边界

🎉 分布式运维监控平台 WGCLOUD v3.6.9 正式发布

RocketMQ 顺序消费实战：批量接口加 Redis Pipeline同步数据

浏览器端 AI 视频实验：结合目标检测与光流实现群体运动追踪

预约上门服务系统开发需要哪些功能？全面解析平台核心模块

热门讨论

热门文章

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

大佬们，我目前的场景是flinkcdc 用sql将mongo数据同步到es，有人做过这样的场景吗？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flinkcdc在IDEA运行正常，打包就报错

Flink CDC taskManager 一直再报下面信息，不知道是不是有什么问题？

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

Flink On Docker 启动 jm 时报这个错误请问有知道这个错误的原因吗？

如何用实时数据同步打破企业数据孤岛？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

展开全部

还有其他疑问?