请问以下问题有什么好的解决方案么?

请问flink中processfunction中使用了guava的限流器,但是运行过程中发现checkpoint总是失败,关于flink限流有什么好的方案吗?场景是这样的:我们读取hdfs文件,解压缩后,然后向下游发送,但是上游发送的速度太快了,如果不限流,直接会让flink主线程卡死

展开
收起
圆葱猪肉包 2023-03-21 13:38:25 231 分享 版权
1 条回答
写回答
取消 提交回答
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    可以考虑使用 Flink 自带的限流工具类 BucketingSink。BucketingSink 可以将数据写入到指定大小的桶(bucket)中,可以设置桶的大小和写入速率。当桶满了之后,会暂停数据的写入,等待桶中的数据被消费后再继续写入。这样可以有效地限制上游数据的发送速率,避免过快地发送导致下游无法处理。

    2023-03-23 15:02:09
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理