开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC全量阶段能按照时间来吗,一些长时间的历史数据不想要?

Flink CDC全量阶段能按照时间来吗,一些长时间的历史数据不想要?

展开
收起
真的很搞笑 2023-12-04 08:09:25 59 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Flink CDC 确实分为全量阶段和增量阶段。在全量阶段,Flink会先获取全局读锁,然后获取整个MySQL实例的全局锁,所有连接MySQL的DDL DML操作均会处于等待读锁阶段。这个阶段通常需要花费较长时间,尤其是当处理的数据表较大时。

    2023-12-04 14:10:10
    赞同 展开评论 打赏
  • 是的,Flink CDC(Change Data Capture)可以在全量阶段根据时间来进行过滤。你可以在读取源数据库的全量数据时,只选择某个时间范围的数据进行同步。

    例如,如果你有一个表,你想从昨天开始同步这个表的变更数据,你可以设置CDC的时间过滤器为昨天的零点。这样,Flink只会读取昨天零点后发生的数据变化,而不会读取之前的历史数据。

    2023-12-04 11:49:15
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载