Flink CDC我第一次启动没有全量同步咋回事?

Flink CDC我第一次启动没有全量同步咋回事?比如今天才开始cdc,昨天之前历史的数据能捕获到吗?

展开
收起
真的很搞笑 2023-11-06 20:27:02 189 分享 版权
2 条回答
写回答
取消 提交回答
  • 存量的有binlog,才会同步吧,此回答整理自钉群“Flink CDC 社区”

    2023-11-08 07:41:00
    赞同 展开评论
  • Flink CDC在第一次启动时,默认会执行全量同步,只读取一次全量数据,而不读取binlog。这种同步策略主要是为了获取数据的初始状态,也就是实时一致性快照。因此,如果你今天刚开始使用CDC,昨天的原始数据是可以通过这次全量同步捕获到的。

    在全量阶段同步完成之后,Flink CDC就可以进行增量读取了。然而,如果发现并没有开始同步增量数据,可能的原因有两个:一是MySQL中对应的数据库没有开启binlog;二是设置的checkpoint间隔时间过大,例如20分钟,这会导致作业20分钟后才开始同步增量数据。因此,需要根据业务情况合理配置相关参数。

    2023-11-07 11:04:03
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

还有其他疑问?
咨询AI助理