开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC我参与计算的规则是来自于第三方mysql数据库的,除了CDC这种方案还有哪种方案?

Flink CDC我参与计算的规则是来自于第三方mysql数据库的,除了CDC这种方案,还有哪种方案?

展开
收起
真的很搞笑 2023-11-01 14:51:20 67 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    除了CDC之外,还有很多种其他的方案可以用于从第三方 MySQL 数据库中获取实时数据,比如以下几种:

    1. Binlog 直接订阅:这是一种比较传统的方法,可以在 MySQL 的二进制日志文件中提取变动数据,然后通过一些工具把提取的结果转发给 Flink 处理。这种方案的好处是可以控制粒度,但缺点是对代码要求较高。
    2. 数据订阅服务:像 RabbitMQ、Apache Pulsar、Redis Stream 等都可以作为中介层,实现对 MySQL 数据库的实时订阅,再把这些数据传送给 Flink 处理。这种方案的优点是代码简洁易用,但需要增加额外的中间组件。
    3. 实时查询:通过 JPA、Hibernate 等 ORM 框架实现 MySQL 实时查询,这种方式更加简单,但是会对数据库造成较大的压力,不适合作为高性能的数据源。
    4. Spark Streaming 或 Apache Beam:可以连接 MySQL 并读取实时数据,然后进行实时分析。
    2023-11-02 14:53:13
    赞同 1 展开评论 打赏
  • 除了使用Flink CDC的方案外,你还可以考虑以下几种方案:

    1. 数据抽取:你可以定期从第三方MySQL数据库中抽取数据,然后在你的计算节点上进行计算。这种方式的优点是可以灵活地控制数据抽取的频率,而且不需要实时处理数据。缺点是需要额外的存储空间来存储抽取的数据,而且在处理大量数据时可能会比较慢。

    2. 数据同步:你可以使用其他的数据同步工具,如Apache Nifi、Apache Kafka等,将第三方MySQL数据库中的数据同步到你的计算节点上。这种方式的优点是可以实时处理数据,而且可以并行处理数据,提高处理速度。缺点是需要额外的硬件资源和软件资源来运行数据同步工具,而且可能需要复杂的配置和管理。

    3. 数据订阅:你可以使用消息队列或其他的消息传递系统,订阅第三方MySQL数据库中的数据变化,然后在你的计算节点上进行计算。这种方式的优点是可以实时处理数据,而且可以在多个计算节点之间共享数据,提高处理效率。缺点是需要额外的硬件资源和软件资源来运行消息传递系统,而且可能需要复杂的配置和管理。

    4. 数据API:如果你有访问第三方MySQL数据库的API权限,你可以直接通过API来获取数据,然后在你的计算节点上进行计算。这种方式的优点是可以灵活地控制数据获取的频率,而且不需要额外的硬件资源和软件资源。缺点是可能会受到API调用次数的限制,而且可能需要处理API返回的数据格式问题。

    2023-11-02 14:41:57
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载