Flink CDC底层监听是不是用到flink定时任务还是啥?
Flink CDC 底层监听使用的是一种名为 LogMiner 的技术,可以监控 MySQL 数据库中的 binlog 日志,并从中抽取增删改操作,将其转换成流式处理。
LogMiner 使用了一系列 Logminer Filter 来实时监听 MySQL 数据库中的 binlog 日志,并将实时变化的数据发送到 Flink CDC Source 中。
此外,在 Flink CDC 应用中,可以设置检查点和并发数等参数,以便更好地控制同步性能和稳定性。
总的来说,Flink CDC 并不是基于定时任务来运行的,而是基于 LogMiner 技术实时监听 MySQL 数据库的变化,并将其转换成流式处理。因此,它是实时的、低延时的。
Flink CDC底层的数据同步并不是通过定时任务来实现的,而是依赖于数据库的变更数据捕获(Change Data Capture,CDC)技术。核心思想是监测并捕获数据库的变动,包括数据的插入、更新、删除等操作,将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。
Flink CDC的实现原理通常来讲,分为主动查询和事件接收两种技术实现模式。对于主动查询而言,用户通常会在数据源表的某个字段中,保存上次更新的时间戳或版本号等信息,然后下游通过不断的查询和与上次的记录做对比,来确定数据是否有变动。
当视图的数据发生变化时,Flink CDC会通过相应的逻辑来捕获这些变化并进行处理。需要注意的是,在监控视图的变化时,需要保证视图的定义和访问权限都是正确的,否则可能会导致 Flink CDC 监听不到变化。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。