开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink流处理过程中,涉及到大量历史数据,需要关联后输出,是不是只能从DB里面再查出来关联,感觉?

Flink流处理过程中,涉及到大量历史数据,需要关联后输出,是不是只能从DB里面再查出来关联,感觉会慢很多吧,有没有其他好方案?

展开
收起
真的很搞笑 2023-08-01 12:02:33 67 0
1 条回答
写回答
取消 提交回答
  • 可以使用 Flink CDC 来实时读取数据库变化,然后与实时数据进行关联处理。

    Flink CDC 可以通过监听数据库的 binlog 日志,实时捕获数据库的变更,并将变更数据转换为 Flink 的流数据。然后,Flink 就可以将流数据与实时数据进行关联处理。

    Flink CDC 可以通过以下方式实时读取数据库变化:

    使用 Flink CDC 的 Debezium 连接器
    使用 Flink CDC 的 MySql 连接器
    使用 Flink CDC 的 PostgreSQL 连接器
    使用 Flink CDC 的 Oracle 连接器
    使用 Flink CDC 进行实时读取数据库变化,可以实现以下优势:

    实时性高
    数据一致性好
    无需维护数据同步程序
    希望本文对你有所帮助。

    2023-09-26 11:22:52
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载