开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC我向mysql中插入数据成功,但是flinkcdc监控不到插入的数据呢?

Flink CDC使用flinkcdc监控mysql写入到starrocks中,初始化成功之后,我向mysql中插入数据成功,但是flinkcdc监控不到插入的数据呢?用的多并行度?image.png

展开
收起
cuicuicuic 2023-12-01 10:46:49 28 0
2 条回答
写回答
取消 提交回答
  • 在Flink CDC中,当设置多并行度时,数据的顺序处理可能会受到影响。多个并行任务并行处理数据,并且数据到达的顺序可能无法保证。因此,如果你需要保证数据的顺序处理,可以尝试以下方法:

    1. 使用单并行度:将 Flink CDC 作业的并行度设置为 1,这样只会有一个任务处理数据,确保了数据的顺序处理。但这也会限制作业的吞吐量和并行处理能力。
    2. 使用时间属性进行分区:如果你的数据流中有时间属性(例如事件时间或处理时间),可以使用 Flink 的 EventTime 或 ProcessingTime 进行分区。通过对数据进行按键分区,确保同一键的数据由同一个任务处理,可以维护某种程度的顺序。

    关于你的问题,首先请确认MySQL的binlog是否正确生成,并且可以被Flink CDC读取。然后检查Flink CDC是否能够连接到MySQL,并且可以读取binlog文件。最后确认Flink CDC是否能够将数据正确地写入到StarRocks中。如果以上都没问题的话,那么问题可能出在并行度上。你可以试着调整并行度看看问题是否可以得到解决。

    2023-12-02 16:05:40
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    使用Flink CDC监控MySQL写入到StarRocks时,如果初始化成功后无法看到插入数据,请确认配置、检查任务状态和数据同步。确保多并行度设置正确,每张表至少有一个并行源实例在读取变更事件。检查MySQL的binlog是否启用且包含需要监控的数据库和表。

    2023-12-01 18:07:53
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载

    相关镜像