开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC底层监听是不是用到flink定时任务还是啥?

Flink CDC底层监听是不是用到flink定时任务还是啥?

展开
收起
cuicuicuic 2023-11-07 08:05:05 33 0
3 条回答
写回答
取消 提交回答
  • dbz的监听,debezium,此回答整理自钉群“Flink CDC 社区”

    2023-11-08 07:42:40
    赞同 1 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Flink CDC 底层监听使用的是一种名为 LogMiner 的技术,可以监控 MySQL 数据库中的 binlog 日志,并从中抽取增删改操作,将其转换成流式处理。
    LogMiner 使用了一系列 Logminer Filter 来实时监听 MySQL 数据库中的 binlog 日志,并将实时变化的数据发送到 Flink CDC Source 中。
    此外,在 Flink CDC 应用中,可以设置检查点和并发数等参数,以便更好地控制同步性能和稳定性。
    总的来说,Flink CDC 并不是基于定时任务来运行的,而是基于 LogMiner 技术实时监听 MySQL 数据库的变化,并将其转换成流式处理。因此,它是实时的、低延时的。

    2023-11-07 14:34:34
    赞同 展开评论 打赏
  • Flink CDC底层的数据同步并不是通过定时任务来实现的,而是依赖于数据库的变更数据捕获(Change Data Capture,CDC)技术。核心思想是监测并捕获数据库的变动,包括数据的插入、更新、删除等操作,将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。

    Flink CDC的实现原理通常来讲,分为主动查询和事件接收两种技术实现模式。对于主动查询而言,用户通常会在数据源表的某个字段中,保存上次更新的时间戳或版本号等信息,然后下游通过不断的查询和与上次的记录做对比,来确定数据是否有变动。

    当视图的数据发生变化时,Flink CDC会通过相应的逻辑来捕获这些变化并进行处理。需要注意的是,在监控视图的变化时,需要保证视图的定义和访问权限都是正确的,否则可能会导致 Flink CDC 监听不到变化。

    2023-11-07 10:16:53
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载