备案控制台

开发者社区问答正文

flink1.11的cdc功能对消息顺序性的处理

麻烦请教下各位大神，flink如何处理如下问题：

flink1.11引入cdc，可以解析canal和debezuim发送的CDC数据，其中canal一般是可以指定某些字段作为key进行hash分区发送到同一topic下的不同分区的。

如果源端短时间对pk值进行多次update，则有可能导致发往不同分区，从而无法保证顺序性。

假如

1.有源表和目标表：

create table test(

id int(10) primary key

)

2.源表的增量数据通过canal发往kafka，目标表接收kafka消息进行同步。

3.发往的topic下有三个partition：p0、p1、p2

4.源端和目标端都有一条记录id=1

此时对源端进行两次update：

update1：update test set id=2 where id=1;

update2: update test set id=3 wehre id=2;

假如两条消息都在同一批message中发往kafka，其中update1发送到p1，pudate2发送到p2，这两条消息的顺序性是无法保证的，假如update2先到达，则目标端最终结果为id=2，与源端结果id=3不一致。*来自志愿者整理的flink邮件归档

展开

收起

小阿怪 2021-12-07 10:55:18 1876 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

可以看下 Jark 的《基于 Flink SQL CDC 的实时数据同步方案》文章 [1]. 其中在最后的 Q&A 中描述了 "首先需要 kafka 在分区中保证有序，同一个 key 的变更数据需要打入到同一个 kafka 的分区里面，这样 flink 读取的时候才能保证顺序。"

个人认为，需要 Update 的 key 可以更 canal 采集到 kakfa 的 hash key 一致，这样就保证了有序？

[1] https://mp.weixin.qq.com/s/QNJlacBUlkMT7ksKKSNa5Q*来自志愿者整理的flink邮件归档

2021-12-07 12:09:45

赞同展开评论

问答分类：

canal 消息中间件 Kafka 流计算实时计算 Flink版云消息队列 Kafka 版云解析DNS

问答标签：

实时计算 Flink版CDC 实时计算 Flink版功能实时计算 Flink版cdc功能

问答地址：

开发者社区 > 微服务 > 问答

相关问答

Flink CDC中Paimon 的主要功能是存数据吗？

114

1

0

Flink调度功能什么时候能上？

83

1

0

flink cdc采集选择增量(latest)读取模式,是不是无法使用动态加载表功能了呀？

1344

3

0

Flink新版本功能发布

83

1

0

请问一下Flink，咱们这个平台怎么关闭动态调整并发度的功能？

124

2

0

Flink CDC这个功能只能通过写代码来实现了吗？

144

3

0

Flink CDC OceanBase Connector 未来将增加哪些功能特性？

144

1

0

Flink Job Operator 的自愈修复功能是如何工作的？

61

1

0

Flink Job Adviser 的主要功能是什么？

72

1

0

MySQL CDC 在Flink CDC 2.2 版本中新增了哪项功能？

97

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

上传文件时提示“Illegal file path”，怎么解决的？

阿里云ESA是什么？边缘安全加速和CDN有什么区别？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

相关文章

聊聊场景题：百万人同时点赞怎么办？这个怎么回答

拼多多平台API的功能及应用场景

WebSocket 与 MQTT 在即时通讯中的深度对比与架构选型指南

阿里云服务器2核8G、4核16G、8核32G配置ECS实例规格族和选型指南

从“攒一锅再算”到“来一条就干一条”：大数据批处理到流处理的进化之路

还有其他疑问?