开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC 开启checkpoint会导致全量同步的数据变多,不开启则正常,大家有遇到过吗?

Flink CDC SQL server2016&CDC2.4.1 启动时StartupOptions设置为initial,开启checkpoint会导致全量同步的数据变多,不开启则正常,大家有遇到过吗?

展开
收起
真的很搞笑 2023-11-06 19:37:22 122 0
1 条回答
写回答
取消 提交回答
  • 这个问题可能与Flink CDC SQL server2016和CDC2.4.1的工作原理有关。在启动时,将StartupOptions设置为initial意味着Flink将从初始状态开始处理数据流。而开启checkpoint可能会导致全量同步的数据变多,这可能是因为checkpoint会触发Flink重新处理从初始状态开始的所有数据。另一方面,如果不开启checkpoint,Flink将从上次成功处理的位置继续处理,因此全量同步的数据量可能会较少。

    解决这个问题的一种可能的方法是调整checkpoint的设置。可以尝试减小checkpoint的时间间隔,或者调整并行度等参数,以减少全量同步的数据量。此外,如果使用的是SQL Server 2017或更高版本,并且开启了CDC功能,还需要确保SQL Server代理服务正在运行,因为CDC功能需要这个服务的支持。

    2023-11-10 11:11:34
    赞同 1 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载