Flink CDC全量阶段能按照时间来吗,一些长时间的历史数据不想要?
Flink CDC 确实分为全量阶段和增量阶段。在全量阶段,Flink会先获取全局读锁,然后获取整个MySQL实例的全局锁,所有连接MySQL的DDL DML操作均会处于等待读锁阶段。这个阶段通常需要花费较长时间,尤其是当处理的数据表较大时。
是的,Flink CDC(Change Data Capture)可以在全量阶段根据时间来进行过滤。你可以在读取源数据库的全量数据时,只选择某个时间范围的数据进行同步。
例如,如果你有一个表,你想从昨天开始同步这个表的变更数据,你可以设置CDC的时间过滤器为昨天的零点。这样,Flink只会读取昨天零点后发生的数据变化,而不会读取之前的历史数据。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。