dataworks支持mysql整库实时同步到clickhouse?
确实,DataWorks提供了实时数据同步功能,支持将源端数据库中的部分或全部表的数据变化实时同步至目标数据库中。您可以使用单表或整库同步方式,实现目标库实时保持和源库的数据对应。然而,虽然DataWorks可以将支持的各种数据源数据离线同步至云数据库ClickHouse,目前它还不支持MySQL到ClickHouse的实时同步。
不过,有其他方案可以实现MySQL到ClickHouse的实时同步,例如使用Canal组件完成binlog的解析和数据同步,Canal-Server进程会伪装成MySQL的slave,使用MySQL的binlog同步协议完成数据同步;Canal-Adapter进程负责从canal-server获取解析后的binlog,并且通过jdbc接口写入到ClickHouse。这种方案接受分钟级别的同步延迟,在每天规模500G,记录数目亿级别的场景下表现良好。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。