文档备案控制台

开发者社区问答正文

Flink kafka Consumer的消费起始位置设置在哪里？

Flink kafka Consumer的消费起始位置设置在哪里？

展开

收起

游客qzzytmszf3zhq 2021-12-07 20:16:46 1661 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

如何设置作业从kafka消费数据最开始的起始位置，这一部分flink也提供了非常好的封装。在构造好的FlinkKafkaConsumer类后面调用如下相应函数，设置合适的其实位置。

setStartFromGroupOffsets，也是默认的策略，从group offset位置读取数据，group offset指的是kafka broker端记录的某个group的最后一次的消费位置。但是kafka broker端没有该group信息，会根据kafka的参数"auto.offset.reset"的设置来决定从哪个位置开始消费。

setStartFromEarliest，从kafka最早的位置开始读取。

setStartFromLatest，从kafka最新的位置开始读取。

setStartFromTimestamp(long)，从时间戳大于或等于指定时间戳的位置开始读取。Kafka时戳，是指kafka为每条消息增加另一个时戳。该时戳可以表示消息在proudcer端生成时的时间、或进入到kafka broker时的时间。

setStartFromSpecificOffsets，从指定分区的offset位置开始读取，如指定的offsets中不存某个分区，该分区从group offset位置开始读取。此时需要用户给定一个具体的分区、offset的集合。

一些具体的使用方法可以参考下图。需要注意的是，因为flink框架有容错机制，如果作业故障，如果作业开启checkpoint，会从上一次checkpoint状态开始恢复。或者在停止作业的时候主动做savepoint，启动作业时从savepoint开始恢复。这两种情况下恢复作业时，作业消费起始位置是从之前保存的状态中恢复，与上面提到跟kafka这些单独的配置无关。

2021-12-07 20:16:59

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版kafka 实时计算 Flink版设置云消息队列 Kafka 版consumer 云消息队列 Kafka 版设置

问答地址：

开发者社区 > 微服务 > 问答

相关问答

Flink的datastream api消费holo表的binlog的时候起始时间是怎么设置的？

164

1

0

flink连Kafka的时候consumer状态有办法设置成stable吗？

141

0

0

Flink报错the pull consumer is not supported for c...

103

1

0

有没有遇到flink1.18连接kafka，没有创建kafka consumer，读不到数据的啊？

305

1

0

有没有大佬知道flink任务运行一段时间后的kafka consumer就不消费了，kafka端显示

797

1

0

有大佬知道这是怎么回事么 flink读不到kafka数据

1403

1

0

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

1355

4

0

想问下大佬们，如果flink设置了整体的并行度为2，cdc的source是不是会读取两次重复的bin

1182

2

0

麻烦问一下，我们现在的架构是希望数据统一从 Kafka 中出，但是又想用 Flink CDC，请问

1149

1

0

flink采集mysql的数据，设置的StartupOptions.initial() ，理论上应该

1269

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Dataphin功能Tips系列（95）如何自定义Dataphin告警消息

AI 原生应用开源开发者沙龙·上海站精彩回顾 & PPT 下载

如何优化代码以提高淘宝商品详情API的调用效率？

外卖系统开发真的赚钱吗？90%的创业者可能选错了方向

还有其他疑问?