开发者社区 > 大数据与机器学习 > 正文

大佬能看下Flink CDC这个源表更新或者插入数据sink表为啥没有更新啊

大佬能看下Flink CDC这个源表更新或者插入数据sink表为啥没有更新啊image.png 本地测试需要开checkpoint吗,是row格式的,不需要设置checkpoint,我百度设置'debezium.snapshot.mode' = 'initial' 就行了,这个参数好像需要设置,为啥这个参数影响这么大呢,怎么设置先全量,然后再增量呢,我现在有个场景,有100张表,我想先用spark或者presto计算这个100个表,然后用flink从我计算的点开始增量计算,或者有什么好的办法吗,线上分了100张表,我需要实时计算100张表到一个宽表

展开
收起
真的很搞笑 2023-05-01 15:55:24 164 0
1 条回答
写回答
取消 提交回答
  • 首先确认binlog日志是否开启,检查checkpoint是否设置,binlog日志的设置是否为flinkcdc要求的配置方式,当然,好的,那你是没加同步模式,这是必须指定从哪儿开始同步数据,也就是说是全量还是增量同步,你目前现在用的就是全量,全量同步完后续后续进来的数据就是增量,此回答整理自钉群“Flink CDC 社区”

    2023-05-01 17:42:12
    赞同 展开评论 打赏

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载