开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flink cdc 任务重启,读取新增的表数据不全,没有读取到全量数据

flink cdc 任务MySqlSource.databaseList处理的表为order_1表,现在由于业务迭代需要新增表order_2,这个表order_2在数据库已经存在,我的处理步骤是这样的:先保存了flink任务checkpoint,然后暂停flink任务,修改flink代码,在 MySqlSource.databaseList里增加表order_2,然后基于checkpoint重启flink任务,重启后发现表order_1继续基于检查点读取增量数据,处理正常,但是表order_2只读取了部分数据而没有读取全量数据,我预期是新增处理的表order_2应该读取全量数据,这个因为什么原因,有大佬帮看下不,我想达到预期,应该怎么调整呢,我这个flink任务后续可能会继续增加其他表,不想每次新增表flink任务都全量读取数据重新跑一遍,想达到的预期目标是,现有处理的表继续增量读取,新增处理的表第一次执行全量读取数据;

展开
收起
wisee 2024-07-09 10:47:11 83 0
0 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载