开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC新增数据的话flink最终会触发哪个方法?

Flink CDC新增数据的话flink最终会触发哪个方法?

展开
收起
真的很搞笑 2023-10-18 16:23:23 46 0
2 条回答
写回答
取消 提交回答
  • 当Flink CDC捕获到数据库的新增数据,它能够感知并处理这些修改。具体来说,Flink CDC能感知数据库的所有修改、新增、删除操作,并以流的形式,进行实时的触发和反馈。这种处理方式不仅适用于MySQL,还包括PostgreSQL等其他关系型数据库。此外,Flink CDC还支持通过Debezium等数据流进行同步,适用于已经部署好了Debezium的场景。

    2023-10-21 16:12:39
    赞同 展开评论 打赏
  • Flink CDC的工作原理是通过监听数据库的日志(如MySQL的binlog,SQL Server的transaction log)来获取数据的变更信息,然后根据这些信息生成对应的Flink DataStream。

    对于新增数据,Flink CDC会触发onEvent()方法。在这个方法中,Flink CDC会从日志中解析出数据的变更信息,然后将这些信息转换为Flink可以处理的格式(如Row或String),并添加到DataStream中。

    然后,Flink会根据自身的调度策略和数据的状态管理策略,对DataStream进行处理。例如,Flink可能会将数据发送到下游的operator进行处理,或者将数据存储在checkpoint中以支持故障恢复。

    2023-10-19 14:19:36
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 覃立辉 立即下载
    Flink CDC Meetup PPT - 孙家宝 立即下载
    Flink CDC Meetup PPT - 徐榜江 立即下载