起多个线程来进行Stream load吗?但是几千张表怎么搞好像都不太好处理。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
表的数量倒是无所谓的,因为监听 binlog 以后,处理之前,我会先通过正则去匹配表名,如果表太多,也可以起不同的 slot 去监听不同的正则匹配表。不过由于当时的 doris 是基于 1.1.3 的,没有多表事务,所以如果作业由于某条特殊的记录导致同步失败,job 挂了,无法保证数据的一致性,所以我们一般如果检测到挂了,就自动重启 job,从当前 binlog offset 开始消费。然后自动全量同步一遍。,此回答整理自钉群“Flink CDC 社区”