文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

使用的EmbeddedRocksDBStateBackend ， Managed Memory

使用的EmbeddedRocksDBStateBackend ， Managed Memory 一直100% 这种情况正常吗

展开

收起

游客3oewgrzrf6o5c 2022-08-25 17:25:09 834 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

皮牙子抓饭
在使用EmbeddedRocksDBStateBackend时，Managed Memory保持100%的情况通常并不正常。Managed Memory是Apache Flink用于管理内部状态和缓冲区的一种资源。它用于存储Flink作业的状态信息和中间结果。如果Managed Memory一直保持100%，那意味着Flink作业正在使用大量的内存，可能存在以下几种情况：
1. 数据倾斜：作业中的某些键或操作可能导致数据倾斜，即某些数据比其他数据更频繁地出现，导致内存不均衡。这可能会导致一些任务消耗更多的内存，而其他任务却没有得到充分利用。
2. 状态过大：作业的状态可能非常大，超过了可用的Managed Memory大小。这可能是由于状态的设计不合理或数据量过大导致的。
3. 内存泄漏：可能存在内存泄漏问题，导致内存无法正常释放。这可能是由于资源没有正确地释放、对象引用未被清理或代码中存在其他bug导致的。
针对这些情况，你可以尝试以下几个解决方法：
1. 数据重分区：如果数据倾斜是问题的根源，可以尝试对数据进行重分区，使其更加均衡地分布在不同的任务之间。
2. 状态优化：检查作业中使用的状态，并尝试优化状态的设计和使用方式。可以考虑使用更合适的数据结构、压缩技术或分区策略来减小状态的大小。
3. 增加Managed Memory：如果可能的话，可以尝试增加Flink作业的Managed Memory配置。这样可以为作业提供更多的内存资源，减少100%的情况发生的可能性。
4. 检查内存泄漏：仔细检查代码，确保资源正确释放。可以使用内存分析工具来帮助检测潜在的内存泄漏问题。
请注意，以上建议是基于常见情况和经验分享，具体的解决方法可能需要根据你的具体情况进行调整和优化。
2023-06-09 16:42:59

赞同展开评论

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

购买阿里国外的云服务器是否可以访问谷歌？

93059

50

0

this xml file does not appear to have any style in

61539

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142411

16

0

C语言数组赋值报错，打印出来的是乱码，怎么解决？

1639

1

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

285230

11

0

基础语言百问-Python

69882

30

0

#支付宝授权提示请在支付宝客户端打开链接

25107

19

0

阿里云怎样设置二级域名以及域名解析？

66960

14

0

C语言中default使用注意事项是什么？

1685

1

0

搭建dnf私服需要大概啥配置的

10521

2

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Flink CDC 3.6.0：支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

相约深圳，全球征集｜Flink Forward Asia 2026 演讲议题征集正式启动

Flink Agents 0.3 Roadmap解读

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

Skill即服务：用Agent安全玩转云上Flink

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

有用flink cdc同步mysql到hive这样搞过的源码吗?

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

如何用实时数据同步打破企业数据孤岛？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

展开全部

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

如何在 PyFlink 1.10 中自定义 Python UDF？

Flink: 实时规则引擎助力新零售发展

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

Flink SQL 功能解密系列 —— 阿里云流计算/Blink支持的connectors

展开全部

还有其他疑问?