备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink这个合并过程不是自动进行的吗？

Caused by: org.apache.flink.util.SerializedThrowable: While open a file for random read: /mnt/hadoop/yarn/local/usercache/tomx/appcache/application_1665995808929_366429/flink-io-62d0d9c8-de12-4678-bf64-fa0446105214/job_a79d0fdbbe7d3adf6601b9d1df871a3b_op_EvictingWindowOperator_3d40dac218b144ba619d5f915bddce501_1uuid_3a975d99-78dc-478b-ab40-4a3be2a76afe/db/101082.sst: Too many open files
各位大佬，我在用rocksdb作为状态后端的时候，遇到了这个问题，似乎是sst文件的数量一直在增长，Flink这个合并过程不是自动进行的吗？

展开

收起

真的很搞笑 2024-03-19 12:17:35 31 0

2 条回答

写回答

取消提交回答

芯在这

操作系统的open files 太小了吧，改下句柄数，此回答整理自钉群“【②群】Apache Flink China社区”

2024-03-19 20:26:42

赞同展开评论打赏
梦回故国楼台梦

将军百战死，壮士十年归！
在 Apache Flink 中，当 RocksDB 被用作状态后端时，RocksDB 内部确实有一个后台合并（compaction）流程，它是自动进行的。RocksDB 通过 compaction 过程来管理其 SST 文件（Sorted String Table），包括合并小文件、删除过期或已覆盖的键值对以及释放空间。这个过程有助于优化存储效率和查询性能。

然而，您遇到的问题表明由于某种原因，RocksDB 在尝试打开更多文件时达到了操作系统允许的最大打开文件数限制。这可能是由于以下几个原因：
1. 打开文件句柄限制：操作系统对单个进程可同时打开的文件数量有限制。在 Linux 系统中，可以通过 ulimit -n 命令查看和修改此限制。对于高并发或大量状态存储的应用场景，可能需要增加这个限制。
2. Compaction 不及时或配置不当：如果 RocksDB 的 compaction 配置不合适（例如，阈值设置得过高），可能导致 SST 文件累积过多而未能及时合并。检查并调整 RocksDB 的 compaction 参数可以帮助解决此类问题。
3. 状态增长过快：如果您的应用状态增长速度非常快，以至于 compaction 过程无法跟上新产生的 SST 文件的速度，也可能导致文件数量激增。
4. 资源限制：Flink 或 RocksDB 在运行过程中可能受限于 YARN 等资源管理系统分配的资源，如果磁盘 I/O 或 CPU 资源不足，可能影响 compaction 的效率。
要解决这个问题，您可以考虑以下措施：
- 调整操作系统级别的最大打开文件数限制。
- 调整 RocksDB 的 compaction 参数，使之更适应您的应用场景。
- 监控并优化 Flink 应用的状态存储量和增长率，避免状态无限制膨胀。
- 如果在 YARN 等集群环境中运行，确保给 Flink 任务分配足够的资源，特别是磁盘空间和 CPU。同时，也可以针对 RocksDB 设置合理的内存缓冲区大小以提高写入性能和 compaction 效率。
2024-03-19 13:52:02

赞同展开评论打赏

问答分类：

流计算分布式计算 Hadoop 资源调度实时计算 Flink版

问答标签：

实时计算 Flink版合并

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关产品：

实时计算 Flink版

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

Flink CDC里这些可以尽快合并到主分支吗？

28

1

0

Hologres的mc 离线数据和 Flink 的实时数据合并有好的方案吗？

70

1

0

Flink operator合并具体条件有哪些

10

1

0

Flink宽表如何合并

7

1

0

Flink有遇到输入流合并后输出到一个sink 里面去，过一会sink 里面就收不到数据的情况吗？

24

0

0

Flink CDC有遇到输入流合并后输出到一个sink 里面去，过一会sink 里面就收不到数据吗？

21

0

0

flink sql mysql cdc 2.4现在支持source合并吗？就像这样？

114

1

0

Flink CDC问下hudi的clustering合并小文件是只支持spark吗？

76

1

0

问下, flink cdc已经实现source合并优化了吗，有说在哪个版本实现的吗？

102

1

0

Flink CDC里大家oracle 用cdc 是不是都要改源码才能用啊？这个bug一直不合并？

32

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关产品

实时计算 Flink版

文档详情产品详情

热门讨论

热门文章

不同版本的 flink 如何适配不同版本 kafka，flink-connect-kafka 版本

请问如何用flink sql客户端用yarn application模式提交任务呢？

flink1.15启动后无法访问webui的问题有人遇到过吗

flink web UI 是不是本身不支持登录认证，必须通过nginx来加登录认证？

Flink CDC有遇见这个问题的吗？

Caused by: org.apache.kafka.common.errors.TimeoutE

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flink怎么能够快速消费kafka数据，需要设置什么参数呢？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

Flink CDC中我使用了自定义聚合函数，但是报错这个需要怎么解决呢？

展开全部

OPPO数据中台之基石：基于Flink SQL构建实数据仓库

实时计算 Flink SQL 核心功能解密

通过Flink实时构建搜索引擎的索引

Apache Paimon统一大数据湖存储底座

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

如何正确使用 Flink Connector？

Apache Flink 漫谈系列(04) - State

基于Flink的实时日志分析系统实践

展开全部

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

598

29

去学习

Apache Flink 入门到实战 - Flink开源社区出品

1566

16

去学习

实时计算 Flink 版产品入门与实操

3961

10

去学习

开源 Flink 极速上手教程

1836

7

去学习

大数据实时计算框架Spark快速入门

955

93

去学习

Apache Flink 入门

5053

9

去学习

相关电子书

更多

Flink CDC Meetup PPT - 龚中强 立即下载

Flink CDC Meetup PPT - 王赫 立即下载

Flink CDC Meetup PPT - 覃立辉 立即下载

相关实验场景

更多