开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC监控了10多个表 使用测流输出很慢是为什么?

Flink CDC监控了10多个表 使用测流输出很慢是为什么?image.png

展开
收起
真的很搞笑 2023-09-28 10:39:38 91 0
2 条回答
写回答
取消 提交回答
  • 20E00583-1A69-40a1-B577-4B16CEB648A8.png

    2024-01-21 17:03:48
    赞同 展开评论 打赏
  • 监控了 10 多个表,使用测流输出很慢,可能有以下几个原因:

    配置的 Flink 并行度太低。可以通过调整 parallelism 配置项来提高 Flink CDC 的吞吐量。
    数据量太大。如果数据量很大,可以通过减少 Flink CDC 的采样率来提高吞吐量。
    使用了 Flink CDC 的 batch 模式。Flink CDC 的 batch 模式会将所有的数据读取到内存中,然后再进行处理,这会导致内存使用过多,从而降低吞吐量。建议使用 incremental 模式。
    如果您还不确定导致测流输出很慢的原因,可以提交工单给我们,我们会为您提供帮助。

    2023-10-18 10:18:11
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 热门讨论

    热门文章

    相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载