请教大家,cdc是如何读取增量binlog的呢?

请教大家,cdc是如何读取增量binlog的呢?假如我的源端库有1000张表,我只同步其中10张表数据, 1.cdc会读取到这1000张表的log过来到本地服务器,提取需要的10张,其余丢弃? 2.作业任务去源端读取到10张表的变更记录,只传输10张表的变更记录?

展开
收起
哒哒哒哒哒~ 2023-03-07 11:00:16 207 分享 版权
1 条回答
写回答
取消 提交回答
  • 随心分享,欢迎友善交流讨论:)

    Flink CDC 会连接到 MySQL 数据库的 binlog 日志,然后以增量的方式读取 binlog 中的数据变更信息,然后将这些变更信息转换成 Flink 数据流的形式,最终输出到您指定的 Sink 中。

    对于您提到的问题,答案如下:

    1、Flink CDC 不会直接读取所有表的 binlog 日志,而是会连接到 MySQL 数据库的 binlog,然后通过指定参数的方式来告知 Flink CDC 哪些表需要被同步,因此不需要读取无关的表的 binlog 日志。

    2、是的,Flink CDC 只会读取您指定的需要同步的表的 binlog 日志,然后将这些变更记录传输到您指定的 Sink 中。

    2023-03-07 11:14:59
    赞同 展开评论

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

收录在圈子:
+ 订阅
阿里云 云原生应用平台 肩负阿里巴巴集团基础设施云化以及核心技术互联网化的重要职责,致力于打造稳定、标准、先进的云原生产品,成为云原生时代的引领者,推动行业全面想云原生的技术升级,成为阿里云新增长引擎。商业化产品包括容器、云原生中间件、函数计算等。
还有其他疑问?
咨询AI助理