开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC里假如mysql的binlog有很多个文件,按什么顺序扫描?

Flink CDC里假如mysql的binlog有很多个文件,一小时一个,用mysql-cdc读取binlog 指定开始策略为时间戳,现在的实现是从第一个binlog文件扫source.ts_ms 还是按照binlog文件的更新时间或者创建时间判断从哪个文件开始扫?2a35c00ebd6da14e28f5d27043270a9d.png

展开
收起
小小鹿鹿鹿 2024-03-25 18:25:55 73 0
1 条回答
写回答
取消 提交回答
  • 目前的按照时间戳查找就是按照binlog一条条过滤的,如果你binlog文件多且大,就是很慢
    ,master目前有binglog二分查找算法,可以解决你的问题的。此回答来自钉群Flink CDC 社区。

    2024-03-25 22:59:24
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    搭建电商项目架构连接MySQL 立即下载
    搭建4层电商项目架构,实战连接MySQL 立即下载
    PolarDB MySQL引擎重磅功能及产品能力盛大发布 立即下载

    相关镜像