文档备案控制台

开发者社区云原生容器服务正文

pod内存居高不下

一个dubbo组件，对外提供dubbo服务，部署了4个pod，有一个pod的内存居高不下，如下如：

接入了arms，此pod有full GC，但是内存还是居高不下

arms看了下cpu，发现有一个奇怪的线程占用cpu很高，MICRO_SERVICE_CONFIG_SCHEDULER，其他正常pod这个线程的耗时只有几毫秒，这个有几百毫秒

定位了很久没定位出来，特此向大家求助-_-

展开

收起

tobeno111 2024-08-16 10:47:12 585 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

郑小健

技术浪潮涌向前，学习脚步永绵绵。
遇到一个Dubbo服务部署了4个Pod，其中一个Pod的内存使用率异常高的情况，这可能是由多种原因导致的。下面是一些排查和解决问题的步骤：

1. 监控和诊断
- 查看监控数据：首先确认该Pod的内存使用情况。可以利用Kubernetes自带的监控工具（如Prometheus + Grafana）或者阿里云提供的监控服务来获取详细的内存使用数据。
- 日志分析：检查该Pod的日志文件，看看是否有异常信息或错误提示，这些信息可能会给出问题的线索。
- 堆栈分析：使用Java的JMX工具或其他性能分析工具对内存使用情况进行深入分析，例如使用jmap生成堆转储文件，并使用MAT (Memory Analyzer Tool) 或 VisualVM 进行分析。
2. 应用层面排查
- 代码审查：检查该Pod对应的应用代码，特别关注可能导致内存泄漏的部分，例如缓存管理、线程池管理等。
- 依赖检查：确保所有依赖包都是最新版本，有时候旧版本的依赖包可能会有已知的内存泄漏问题。
- 并发控制：检查Dubbo服务的并发设置，过高或不合适的并发设置可能会导致内存使用异常。
- 垃圾回收：检查JVM的垃圾回收参数是否合理，是否需要调整JVM参数来改善垃圾回收效率。
3. 配置与环境
- 资源限制：检查该Pod的资源限制配置（如limits和requests），确保内存分配足够但不过度。
- 环境差异：比较这个异常Pod与其他正常Pod的运行环境，包括配置、版本、依赖等，找出差异点。
4. 故障隔离与恢复
- 重启Pod：尝试重启异常的Pod看是否能解决问题。
- 滚动更新：如果怀疑是代码问题，可以尝试通过滚动更新（Rolling Update）的方式更新应用，观察是否解决了问题。
- 隔离测试：将异常Pod单独部署在一个新的环境中，观察是否还会出现同样的问题，有助于排除环境因素的影响。
5. 性能优化
- 内存优化：根据分析结果，针对性地进行代码优化或参数调整，降低内存消耗。
- 水平扩展：如果是因为负载过高导致的内存问题，可以考虑增加更多的Pod来分散负载。
2024-08-16 11:00:52

赞同 5 展开评论

问答分类：

Perl 应用服务中间件 Dubbo 应用实时监控服务

问答标签：

pod内存

问答地址：

开发者社区 > 云原生 > 容器服务 > 问答

相关问答

容器服务Kubernetes版

ARMS能否监控到Pod发生OOM时的内存使用量

243

1

0

使用Serverless 容器，pod可以不做内存和cpu的请求及限制，按服务的实际使用来分配吗？

319

4

0

nacos单个pod要占用4 G内存，是不是存在内存泄露，还是属于正常情况?

882

4

0

Nacos内存监控到快6g的时候对应节点的pod就会重启，这个问题该怎么排查呢？

223

1

0

ARMS 应用监控中CPU/内存配额与 pod 实际设置不一致，是由于什么原因造成的？

256

0

0

阿里云ARMS在哪里能看某个node的pod内存使用率排行？

207

1

0

容器服务ACK prome可以看到某个node的pod内存使用率吗？

170

1

0

ARMS应用监控的堆内存和在pod内看到的 java内存相差太多是什么原因

194

1

0

容器服务中有pod占用内存高于服务本身

540

1

0

ARMS 应用监控中CPU/内存配额与 pod 实际设置不一致

161

0

0

云原生

容器服务

国内唯一 Forrester 公共云容器平台领导者象限。

我要提问

相关文章

OSS + CDN + 数据万象：亿级图片处理架构从0到1的完整实战

Python的生成器把我坑惨了，原来yield和return的区别这么大

一家公司多个域名多个站点，OV多域名证书一个方案全搞定

HikariCP + Tomcat + Spring Boot：九个容易被忽视的默认值配置

基于javaweb的图书管理系统的设计和实现

热门讨论

热门文章

怎么查看registry.aliyuncs.com/google_containers都有哪些镜像

Dify与传统开发工具，你会选择哪一个？

容器镜像服务ACR这个有办法在我启动容器的时候通过参数控制吗？

有办法限制 docket 容器的内存吗？

registry.aliyuncs.com/google_containers这个镜像仓库都有啥镜像

阿里云ASK的 vpc专有网络的费用怎么看？

流水线操作进行预发部署时，提示“修改服务失败:预发环境当前环境的部署配置非阿里云容器，请修改部署配置”。

如何理解容器在混合云架构下的统一管理场景的应用？

阿里云容器服务中链路追踪为分布式应用开发者提供了哪些工具？

问下 OpenKruise中的SidecarSet适合管理有状态的sidecar容器吗？

展开全部

Minikube - Kubernetes本地实验环境

Docker的Windows容器初体验

利用Zipkin对Spring Cloud应用进行服务追踪分析

当 Kubernetes 遇到阿里云

谈谈 Docker Volume 之权限管理（一）

在阿里云容器服务上开发基于Docker的Spring Cloud微服务应用

Docker Engine 镜像源站

邱剑 | 美团云容器实践之路

Maven Docker镜像使用技巧

DevOps与阿里云容器服务（三）

展开全部

还有其他疑问?