备案控制台

开发者社区大数据与机器学习正文

请问，flink cdc 全量同步不加锁，如果要同步binlog之前的数据的话，是通过select

请问，flink cdc 全量同步不加锁，如果要同步binlog之前的数据的话，是通过select 查表获取全量数据的吗？另外：在同步全量数据的同时，如果数据库还有更新，那么是如何解决的？

展开

收起

真的很搞笑 2023-04-26 15:59:10 149 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

在Flink CDC进行全量同步时不加锁的情况下，确实是通过执行SELECT语句来获取MySQL表中的全量数据。这个过程可能会对数据库造成一定的查询压力，尤其是在处理大型表时。

关于您提到的同步全量数据的同时数据库仍有更新的情况，Flink CDC的处理方式如下：

记录Binlog位点：在全量数据抽取开始之前，Flink会记录当前的Binlog位置。这样，在全量数据抽取完成后，能够从该记录的位点开始读取增量的Binlog数据，确保不丢失在此期间数据库内的任何更新操作。
Snapshot与Stream的结合：Flink CDC的工作流程分为两个阶段——Snapshot阶段（全量数据抽取）和Stream阶段（增量数据即Binlog的读取）。在Snapshot阶段，尽管数据库可能有新的更改，但这些更改会在Stream阶段被后续的Binlog读取捕捉到，从而实现最终的数据一致性。这意味着即使在全量抽取过程中有数据变更，这些变更也会在后续的增量处理中被正确反映出来，不会导致数据不一致。

综上所述，Flink CDC通过先全量抽取再增量消费Binlog的方式，确保了在抽取全量数据的同时，数据库的实时更新能够在后续处理中被正确捕获和应用，以此达到数据的最终一致性。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

数据库流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版数据实时计算 Flink版cdc同步实时计算 Flink版同步实时计算 Flink版cdc数据

问答地址：

开发者社区 > 大数据与机器学习 > 问答

相关问答

在Flink CDC中，请问下是没有数据，但却有binlog吗？

121

1

0

Flink的datastream api消费holo表的binlog的时候起始时间是怎么设置的？

122

1

0

在Flink CDC中，要读很多gtid，会存在过期的gtid，就会报binlog解析的错误？

108

0

0

flink-cdc 在抽取mysql binlog，运行一段时间 source 就报java.uti

1244

3

0

请问 flinkcdc的时候 checkpoints里的mysql binlog pos不变吗？

788

10

0

大佬们，cdc mysql 可以获取binlog，binlog模式必须是row吗？

991

1

0

我的mysql的binlog已经开启了但是flink cdc的打印显示没有读取到binlog文件，

1034

0

0

有没有遇到同步MySQL一直卡在某个binlog文件？数据库已经确认后续的binlog都生成了 io

894

0

0

请问下Flink CDC datastream 采集mysql binlog数据，如何每次重启的时候

710

0

0

使用flink cdc官方案例，读取mysql binlog日志到 flink，为何没有输出？

2087

1

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

相关文章

借助 Coze 构建四阶工作流：AI驱动的全链路测试效能提升实战

vsan数据恢复—Vsan存储架构解析及非正常关机故障的数据恢复案例

从漏洞到攻击链：一次看懂黑客的思维链路

Redis数据库的五类核心数据结构详解

阿里云卡券解析：优惠券、代金券、提货券、储值卡领取和使用指南及常见问题

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

DataWorks表管理创建表报precision and scale is not current

虚拟机占用内存特别大，90多个G,网上各种方法都试过了，怎么解决这个问题

阿里云磁盘大小是多少？

有人知道server busy是什么情况吗？

如何用实时数据同步打破企业数据孤岛？

在斗鱼，实时计算发展的历程如何？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

展开全部

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

你刚吃的兰州牛肉面，背后就藏着大数据

odps是什么?

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

如何轮播 DataV 大屏

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

展开全部

还有其他疑问?