请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设置 'sink.semantic' = 'exactly-once',

展开

收起

雪哥哥 2022-11-05 21:46:34 1355 版权

4 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

offset提交策略修改一下就可以了，单独设置 'sink.semantic' = 'exactly-once'应该不够的。

2023-01-30 17:58:57

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，根据你的问题描述，你可以重启任务，然后追踪一下重新开启之后是否正常，然后再排除一下提交策略。

2023-01-30 14:07:36

赞同展开评论
V主宰

任务重启重复消费一段Kafka消息是正常的，只有这样才能保证Exactly Once语义。Flink会将Kafka位点与状态对应起来，因此即使重复消费，也会保证落库数据的准确性

2023-01-30 11:56:29

赞同展开评论
认真学习的heart

可以尝试设置Kafka的offset提交策略，比如设置为“每次提交”，这样每次消费完消息之后就会提交offset，重启之后就不会重复消费消息了。

2023-01-17 16:27:04

赞同展开评论

问答分类：

消息中间件 Kafka 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版kafka 云消息队列 Kafka 版集群实时计算 Flink版重启实时计算 Flink版集群

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。