开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC使用flinksql的时候全量数据 没有checkpoint的情况嘛?

Flink CDC使用flinksql的时候全量数据 没有checkpoint的情况嘛?

展开
收起
真的很搞笑 2023-11-01 14:52:05 115 0
3 条回答
写回答
取消 提交回答
  • 在使用Flink CDC的全量数据读取阶段,当前版本确实不支持checkpoint。CDC读取分为全量读取和增量读取两个阶段,而checkpoint机制只支持增量读取阶段。在全量读取阶段由于需要scan全表数据,并且这个过程可能需要较长时间(例如,对于千万级数据量的表),因此在这个阶段是没有offset可以记录的,也就不能做checkpoint。如果在全量同步过程中出现了问题需要重新开始,那么就不得不重新开始整个同步过程。这也是Flink CDC在使用时需要注意的问题之一。

    2023-11-02 14:32:59
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在Flink CDC中使用Flink SQL的情况下,全量数据抽取可以不用开启check

    2023-11-02 14:33:01
    赞同 展开评论 打赏
  • 阿里的flink支持存本地磁盘,state数据也不是全部存在内存的,此回答整理自钉群“Flink CDC 社区”

    2023-11-01 21:50:42
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载