Flink1.11 的cdc是支持加载历史数据的,有两个问题想求证一下: 1.底层是使用了debezium来加载历史数据的吗? 2.debezium是通过jdbc查询源表的数据来加载全量的历史数据吗? 这块会不会对数据库造成瞬时压力?
希望能帮忙解答一下,谢谢。
*来自志愿者整理的flink邮件归档
Flink支持两种CDC格式,debezium json和 canal json, debezium 和 canal都是CDC系统,简单说他们可以把数据库表的binlog以对应的json写入到消息队列如Kafka, 作为下游系统的Flink 支持去消费对应的cdc数据,两个CDC工作都支持加载历史数据的。 另外Jark 在Veverica 开源了一个Flink CDC connector [1],支持利用debezuim直接读取数据库的cdc数据,不需要搭建CDC系统。
不会,不是直接查询源表,所以不会锁表,加载全量历史数据时只是读取binlog的一个offset*来自志愿者整理的flink
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。