开发者社区> 问答> 正文

如何实现 Flink CDC 中全量和增量日志的并行读取?

如何实现 Flink CDC 中全量和增量日志的并行读取?

展开
收起
花开富贵111 2024-08-19 11:35:46 68 0
1 条回答
写回答
取消 提交回答
  • 为了实现全量和增量日志的并行读取,我们对 Flink CDC 进行了拓展。在程序启动时,Enumerator 会首先创建 BinlogSplit 并放在分配列表的首位,用于执行增量数据采集。同时,Enumerator 也会将全量数据采集任务切分成多个 SnapshotSplit 并分配给 SourceReader 执行。这样,全量和增量日志就可以并行读取了。新增表后,通过恢复任务和对比用户配置与状态信息,可以捕获到新表并为其添加相应的全量和增量数据采集任务。image.png
    image.png

    2024-08-19 16:15:50
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
PostgresChina2018_赖思超_PostgreSQL10_hash索引的WAL日志修改版final 立即下载
Kubernetes下日志实时采集、存储与计算实践 立即下载
日志数据采集与分析对接 立即下载