开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

为什么使用FlinkCDC和Kakfa Sink向Kakfa中发送binlog数据,会存在脏数据?

image.png
1.刚开始kafka配置的是精确一次,后来猜想可能与两阶段提交有关,修改为至少一次时候还是会存在该问题。

2.binlog数据和脏数据并非同时发送到kafka的,根据时间戳分析脏数据应该是在保存检查点的时候发送的。
请问有大佬遇到过这个问题吗,要怎么处理啊?

展开
收起
纵千种风情 2024-10-29 16:30:39 69 0
0 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
PolarDB-X 2.0 全局 Binlog 与备份恢复能 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载