开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC同步全量数据的时候是不是不支持checkpoint啊?

Flink CDC同步全量数据的时候是不是不支持checkpoint啊?

展开
收起
真的很搞笑 2023-11-06 20:15:16 88 0
2 条回答
写回答
取消 提交回答
  • 支持,此回答整理自钉群“Flink CDC 社区”

    2023-11-08 07:41:07
    赞同 展开评论 打赏
  • 是的,Flink CDC在同步全量数据时目前是不支持checkpoint的。这是由于Flink CDC底层是基于Debezium架构,其设计是单节点的,因此只支持单并发。在全量读取阶段,如果表非常大(亿级别),读取时间可能会在小时甚至天级别,用户不能通过增加资源去提升作业速度。

    不过,Flink CDC在增量读取阶段是支持checkpoint的。如果同步全量数据时出现失败的情况,例如作业运行了4小时后失败,需要重新开始,再读取5个小时的数据,这对于用户来说可能难以接受。因此,在全量同步数据时,checkpoint的支持显得尤为重要。

    2023-11-07 11:08:04
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载