大牛请教一下,Flink CDC 全量阶段使用datax, 好多CDC 只支持latest-offset,并不支持指定位点和timestamp,请问这种场景。全量和增量怎么衔接,才不会丢失增量数据?snapshot阶段鸡肋的狠,大表经常搞不定,全量不需要,全量要想切CDC肯定要找个合适的offset,肯定不是,所以说latest-offset 很鸡肋,完全不可控,目前想的方案只能是最终一致,因为flink-cdc 是upsert。先开启latest-offset CDC模式,产生savepoints后,再使用datax导全量,再从cdc的savepoints进行恢复,最终数据会一致
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
应该不是数据量的问题,感觉是源头出了问题,但是我没办法证明。全量用datax能获取到增量需要用到的offset?随便估计一个offset?,此回答整理自钉群“Flink CDC 社区”