文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC消费kafka停止后，使用sp启动，有的拿到的偏移量是-1，导致中间丢数据？

Flink CDC消费kafka停止后，使用sp启动，15个分区都有数据，但是有的拿到的偏移量是-1，导致中间丢数据？

展开

收起

真的很搞笑 2023-10-02 08:40:46 331 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

武当张三丰丶

存在即是合理
当Flink CDC消费Kafka停止后，使用sp启动时，如果某些分区的偏移量为-1，则表示该分区没有可用的数据。这可能是由于在停止Flink CDC消费Kafka时未正确提交偏移量或在重新启动时未正确重置偏移量所致。

要解决这个问题，可以尝试以下思路：
1. 检查Kafka消费者组是否已正确提交了偏移量。可以使用Kafka命令行工具或其他监控工具来查看消费者组的当前偏移量。
2. 如果发现某些分区的偏移量为-1，则可以尝试手动设置这些分区的偏移量。可以使用Flink CDC提供的setStartupMode方法来指定启动模式为“latest”，这将使Flink CDC从最新的偏移量开始消费数据。例如：
  
  Properties properties = new Properties(); properties.setProperty("bootstrap.servers", "localhost:9092"); properties.setProperty("group.id", "test"); properties.setProperty("enable.auto.commit", "false"); properties.setProperty("auto.offset.reset", "earliest"); FlinkKafkaConsumer<String> consumer = new FlinkKafkaConsumer<>( "test_topic", new SimpleStringSchema(), properties); DataStream<String> stream = env.addSource(consumer); stream.setStartupMode(StartupMode.LATEST);
3. 如果仍然无法解决问题，则可能需要重新部署Flink CDC应用程序并确保正确地提交和重置偏移量。
2023-10-23 15:26:34

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版CDC 实时计算 Flink版kafka 实时计算 Flink版数据实时计算 Flink版cdc kafka

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flinksql消费kafka，没有消费记录的分区在sp的时候是不是不保存偏移量？

190

1

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2312

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1929

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1466

2

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

6420

18

0

Flink CDC 使用yarn- application提交python作业报错，有遇到过的么？

380

0

0

flink CDC MySQL to Paimon发生报错

763

0

0

在Flink CDC中,FlinkSQL任务出现这个报错后就不再进行消费了，需要调整什么参数吗?

205

0

0

在Flink CDC中，Hadoop 运行在虚拟机环境报错可能是什么原因呢？

195

0

0

在Flink CDC中，用pipeline 连接器同步mysql数据到kafka报错了，缺少什么？

308

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

老城区改造IOC数字孪生平台量化指标与误差控制规范

高速服务区数字孪生监测平台量化指标与误差控制规范

硫化厂数字孪生管理平台量化指标与误差控制规范

自建商城平台交易架构与合规分账路径全流程设计分享

5层通信栈：多Agent集群为什么不能用一种方式通信

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

Flink cdc sqlserver 希望不同步某些数据行

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Flink CDC 能适配达梦不？

展开全部

实时计算 Flink SQL 核心功能解密

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

深入了解 Flink 网络栈（二）：监控、指标和处理背压

Flink: 快速构建统一的实时日志平台

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

基于实时计算（Flink）与高斯模型构建实时异常检测系统

Apache Flink 漫谈系列(09) - JOIN 算子

Apache Flink 零基础入门教程（六）：状态管理及容错机制

Apache Flink 进阶（一）：Runtime 核心机制剖析

展开全部

还有其他疑问?