备案控制台

开发者社区问答正文

Flink Kafka作业异常重启，从Checkpoint恢复后重复推送数据部分数据如何处理？

Flink ETL作业生成实时DWD宽表数据，写入Kafka中。当ETL作业的TM出现异常，自动重启恢复后，作业虽然能从上一次Checkpoint状态恢复，但是会出现重复推送部分数据，导致下游DWS相关作业都要进行去重处理，增加下游作业成本。想了下解决方案，扩展Kafka Sink，初始化的时候，先读取当前State中记录的位置后面的所有数据，然后写入的时候进行去重处理，恢复到正常位置后，清理掉这部分数据。想问下大佬们，这种处理方式是否合理，或者有没其他更好的解决方案？ *来自志愿者整理的flink邮件归档

展开

收起

游客sadna6pkvqnz6 2021-12-07 16:55:37 2813 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

checkpoint 只能保证 state 的 exactly once，但是单条数据可能重复处理多次，如果是 sink 输出多次的话，或许你可以看一下 TwoPhaseCommitSinkFunction 相关的，这篇文章有一个相关的描述[1]

[1] https://www.ververica.com/blog/end-to-end-exactly-once-processing-apache-flink-apache-kafka*来自志愿者整理的flink

2021-12-07 20:21:39

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

实时计算 Flink版kafka 实时计算 Flink版数据云消息队列 Kafka 版flink 实时计算 Flink版重启实时计算 Flink版checkpoint

问答地址：

开发者社区 > 微服务 > 问答

相关问答

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2100

1

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

1963

3

0

flink1.13.5 mysql-cdc-2.2.0 mysql 5.6 一次同步90w数据后不同

363

0

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1222

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1240

2

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

864

1

0

flink cdc 怎么做断点续传啊

6283

6

0

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

1420

5

0

请教下有flink cdc 对接mysql5.6的demo么？我这边显示各种包错误

1178

4

0

flink cdc支持国产数据库吗？

962

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云短信服务工程师连我方发送记录只会收阿里云错误码都不知道吗？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

我就想把本地的 vm 虚拟机迁移到 ECS，整的这些文档又臭又长，有这精力你录个视频不行吗？

为什么现在连qwen3-coder 之类的模型都不能选了，就一个智能回答？

biz.util.invokeWorkbench这个api打开窗口方式变了

相关文章

Linux环境下 java程序提交spark任务到Yarn报错

【JUC】（3）常见的设计模式概念分析与多把锁使用场景！！理解线程状态转换条件！带你深入JUC！！文章全程笔记干货！！

Spring框架优化：提高Java应用的性能与适应性

实时库存同步接口技术详解

如何设计10亿用户级的微博Feed流系统并应对100W QPS的挑战？

还有其他疑问?