开发者社区 > 云原生 > 正文

请教大家,cdc是如何读取增量binlog的呢?

请教大家,cdc是如何读取增量binlog的呢?假如我的源端库有1000张表,我只同步其中10张表数据, 1.cdc会读取到这1000张表的log过来到本地服务器,提取需要的10张,其余丢弃? 2.作业任务去源端读取到10张表的变更记录,只传输10张表的变更记录?

展开
收起
哒哒哒哒哒~ 2023-03-07 11:00:16 195 0
1 条回答
写回答
取消 提交回答
  • 随心分享,欢迎友善交流讨论:)

    Flink CDC 会连接到 MySQL 数据库的 binlog 日志,然后以增量的方式读取 binlog 中的数据变更信息,然后将这些变更信息转换成 Flink 数据流的形式,最终输出到您指定的 Sink 中。

    对于您提到的问题,答案如下:

    1、Flink CDC 不会直接读取所有表的 binlog 日志,而是会连接到 MySQL 数据库的 binlog,然后通过指定参数的方式来告知 Flink CDC 哪些表需要被同步,因此不需要读取无关的表的 binlog 日志。

    2、是的,Flink CDC 只会读取您指定的需要同步的表的 binlog 日志,然后将这些变更记录传输到您指定的 Sink 中。

    2023-03-07 11:14:59
    赞同 展开评论 打赏

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

相关电子书

更多
PolarDB-X 2.0 全局 Binlog 与备份恢复能 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载