开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

请问以下问题有什么好的解决方案么?

请问flink中processfunction中使用了guava的限流器,但是运行过程中发现checkpoint总是失败,关于flink限流有什么好的方案吗?场景是这样的:我们读取hdfs文件,解压缩后,然后向下游发送,但是上游发送的速度太快了,如果不限流,直接会让flink主线程卡死

展开
收起
圆葱猪肉包 2023-03-21 13:38:25 207 0
1 条回答
写回答
取消 提交回答
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    可以考虑使用 Flink 自带的限流工具类 BucketingSink。BucketingSink 可以将数据写入到指定大小的桶(bucket)中,可以设置桶的大小和写入速率。当桶满了之后,会暂停数据的写入,等待桶中的数据被消费后再继续写入。这样可以有效地限制上游数据的发送速率,避免过快地发送导致下游无法处理。

    2023-03-23 15:02:09
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载