开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC可以实现批量抽取吗?

Flink CDC可以实现批量抽取吗?我们现在想把所有的同步任务都是用CDC,针对于实时性不高的,想通过一天一增量同步?

展开
收起
真的很搞笑 2023-12-04 08:09:26 70 0
3 条回答
写回答
取消 提交回答
  • 3.0 支持filter
    image.png
    举个例子,你可以update_time = 昨天时间的 ,此回答整理自钉群“Flink CDC 社区”

    2023-12-05 08:21:21
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Flink CDC可以实现批量抽取。在Flink CDC中,可以通过设置checkpoint间隔和并行度来实现批量抽取。

    具体来说,可以将checkpoint间隔设置为一天的时间间隔,这样每个checkpoint之间就会有一个增量数据。同时,可以设置并行度来控制每次抽取的数据量大小。通过这种方式,可以实现每天一增量同步的需求。

    需要注意的是,批量抽取可能会导致数据延迟,因为需要等待checkpoint间隔才能进行下一次抽取。如果实时性要求较高,可以考虑使用流式抽取的方式。

    2023-12-04 14:07:36
    赞同 展开评论 打赏
  • Flink CDC确实可以实现批量抽取,并且可以用于处理实时性不高的数据同步任务。Flink CDC是一个基于Apache Flink开发的数据获取组件,主要用于捕获数据变更。它能够将源数据库的增量变动记录同步到一个或多个目标位置,在同步的过程中还可以对数据进行一定的处理,例如分组(GROUP BY)、多表关联(JOIN)等。

    对于你们想通过一天一增量来进行数据同步的需求,Flink CDC也能很好地满足。你可以设置Flink CDC以小时或天为单位来抽取数据,这样就可以实现一天一增量的同步了。此外,Flink CDC不仅可以读取MySQL的数据,还可以读取Oracle等其他数据库的数据。

    2023-12-04 11:46:08
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载