请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设置 'sink.semantic' = 'exactly-once',

展开

收起

雪哥哥 2022-11-05 21:46:34 1521 版权

4 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

offset提交策略修改一下就可以了，单独设置 'sink.semantic' = 'exactly-once'应该不够的。

2023-01-30 17:58:57

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，根据你的问题描述，你可以重启任务，然后追踪一下重新开启之后是否正常，然后再排除一下提交策略。

2023-01-30 14:07:36

赞同展开评论
V主宰

任务重启重复消费一段Kafka消息是正常的，只有这样才能保证Exactly Once语义。Flink会将Kafka位点与状态对应起来，因此即使重复消费，也会保证落库数据的准确性

2023-01-30 11:56:29

赞同展开评论
认真学习的heart

可以尝试设置Kafka的offset提交策略，比如设置为“每次提交”，这样每次消费完消息之后就会提交offset，重启之后就不会重复消费消息了。

2023-01-17 16:27:04

赞同展开评论

问答分类：

消息中间件 Kafka 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版kafka 云消息队列 Kafka 版集群实时计算 Flink版重启实时计算 Flink版集群

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

E-MapReduce集群KAFKA指标介绍

244

canal发送消息到kafka集群，为什么总是发往分区0？有大佬遇到过嘛

226

在Confluent集群中如何新建一个名为pv-uv的Topic，并设置其分区数为3？

181

如何在Confluent集群中创建一个新的消息队列（Topic）？

208

在Flink CDC中，集群模式已经重启还是不行？

185

在Flink CDC中，flink单机部署，重启flink客户端，之前正在运行的job可以自启动吗？

293

使用Flink HA模式可以做到flink集群重启后自动恢复正在运行的job吗？

195

如何监控Kafka集群的断传和积压情况？

425

flink连Kafka的时候consumer状态有办法设置成stable吗？

242

在Flink CDC中抽取数据凌晨失败了白天重启任务它还从之前零点失败时候的点位开始消费？

403

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。