开发者社区 问答 正文

如何实现 Flink CDC 中全量和增量日志的并行读取?

如何实现 Flink CDC 中全量和增量日志的并行读取?

展开
收起
花开富贵111 2024-08-19 11:35:46 113 发布于黑龙江 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 为了实现全量和增量日志的并行读取,我们对 Flink CDC 进行了拓展。在程序启动时,Enumerator 会首先创建 BinlogSplit 并放在分配列表的首位,用于执行增量数据采集。同时,Enumerator 也会将全量数据采集任务切分成多个 SnapshotSplit 并分配给 SourceReader 执行。这样,全量和增量日志就可以并行读取了。新增表后,通过恢复任务和对比用户配置与状态信息,可以捕获到新表并为其添加相应的全量和增量数据采集任务。image.png
    image.png

    2024-08-19 16:15:50 举报
    赞同 1 评论

    评论

    全部评论 (0)

    登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等