大牛请教一下,Flink CDC 全量阶段使用datax, 好多CDC 只支持latest-?

大牛请教一下,Flink CDC 全量阶段使用datax, 好多CDC 只支持latest-offset,并不支持指定位点和timestamp,请问这种场景。全量和增量怎么衔接,才不会丢失增量数据?snapshot阶段鸡肋的狠,大表经常搞不定,全量不需要,全量要想切CDC肯定要找个合适的offset,肯定不是,所以说latest-offset 很鸡肋,完全不可控,目前想的方案只能是最终一致,因为flink-cdc 是upsert。先开启latest-offset CDC模式,产生savepoints后,再使用datax导全量,再从cdc的savepoints进行恢复,最终数据会一致

展开
收起
真的很搞笑 2023-05-14 20:07:20 1305 分享 版权
1 条回答
写回答
取消 提交回答
  • 应该不是数据量的问题,感觉是源头出了问题,但是我没办法证明。全量用datax能获取到增量需要用到的offset?随便估计一个offset?,此回答整理自钉群“Flink CDC 社区”

    2023-05-14 20:13:56
    赞同 展开评论

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

还有其他疑问?
咨询AI助理