开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink 想全量同步,但是历史数据只同步过来最后一条,请问一下什么原因导致的呀?

Flink CDC 中scan.startup.mode设置了initial,想全量同步,但是历史数据只同步过来最后一条,请问一下什么原因导致的呀?源库与目标库都是oracle

展开
收起
三分钟热度的鱼 2024-03-20 14:46:56 108 0
1 条回答
写回答
取消 提交回答
    • scan.startup.mode设置为initial时,Flink CDC应该从指定的起始SCN(系统改变号)开始读取所有历史数据。如果仅同步到了最后一条记录,可能是由于:
      • 起始SCN设置不正确,没有指向期望的历史数据起点。
      • 配置项有误,没有正确指定要包含所有历史数据的范围。
      • 源库的CDC配置问题,例如binlog格式、过滤规则或其他相关设置限制了Flink CDC获取全量数据的能力。
      • 状态保留或checkpoint问题,如果作业的状态已清理或checkpoint未能完整保存历史进度信息。
    2024-03-20 16:13:27
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载