FGC频繁导致CPU 飙升定位及JVM配置优化总结-阿里云开发者社区

FGC频繁导致CPU 飙升定位及JVM配置优化总结

2024-07-28 616

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： FGC频繁导致CPU 飙升定位及JVM配置优化总结

本文为博主原创，未经允许不得转载：

目录：

　　1. 定位消耗cpu 的服务进程和线程

　　2. 定位FGC 的原因

　　3. 定位jvm 参数是否导致FGC

　　4. 调试最优解的 jvm 配置

　　描述：项目中存在一个后台服务，该后台服务主要用来执行定时任务与kafka 中间件消息的消费。在压测环境上部署时，观察到 cpu 的使用率异常，竟然达到了 600%，所以记录下该问题的定位和解决过程，以帮助更多的伙伴。

1. 定位消耗cpu 的服务进程和线程

　　使用top 命令查看服务器的cpu使用情况

top

　　获取 top 中cpu 占用率最高的进程的pid ，通过 top -H -P pid 获取该进程对应所有线程的使用情况

top -H -p pid

　　通过上面命令得到使用cpu 最高的线程号 threadId ，将线程号通过命令转换为十六进制：

printf "%x\n" threadId

　　通过以上命令获取到jvm中对应的 nid , 通过 jstack 查看该 threadId 线程的堆栈信息：

jstack -l pid| grep -10 nid

　　通过以上命令判断该线程执行任务的内容，从而推断导致cpu飙升的原因。

项目中碰到导致cpu飙升的原因是存在较多的 FGC 线程，从而怀疑是项目内部不断FGC 导致CPU飙升，从而监控项目的FGC 频率

2. 定位FGC 的原因

　　通过 jstat 命令查看 FGC 的频率。

jstat  -gc   pid  3000

　　发现 FGC 每隔三秒要进行9次左右的FGC垃圾回收。由于FGC 会导致STW （stop the world）现象，及服务不可用。

　　需要定位 jvm 内存中的堆栈内容与线程。通过 Visualm 远程监控服务的jvm 性能，jvisualm 使用可参考这篇文章（https://www.cnblogs.com/zjdxr-up/p/14916455.html），通过 jvisualm 查看服务当前存在的线程和堆内容。通过jvisualm 将堆内容与线程进行dump 之后，发现并未存在异常的内容。且定时任务与kafka 都是开源的成熟框架，应该不会是导致频繁FGC 的主要原因。

　　所以怀疑可能服务的 jvm 参数配置存在问题，因为如果 jvm 参数设置不合理，当老年代的内存达到一定比例，则会进行FGC。下一步定位 jvm 的参数是否是主要原因。

3. 定位jvm 参数是否导致FGC

　　由于我们的服务启动都会设置最大堆内存和初始化堆内存等参数，所以需要调整不同jvm 参数时，服务内部的FGC 情况。

　　以下为我们服务设置的 JVM 相关参数

-Xmn512m -Xms512m -Xmx2048m -XX:NewSize=512M -XX:MaxNewSize=512M -XX:-UseAdaptiveSizePlicy 
-XX:ParallelGCThreads=16 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:MaxTenuringThreshold=15

　　为了形成做对比，采取 java -jar 的方式启动服务，不手动设置jvm相关配置，使用 JVM 默认的配置，进行观察是否有变化。

　　通过 java -jar 方式启动，使用默认配置之后，再采用 top 观察cpu 使用与 jstat 观察 FGC 频率，发现 cpu 的使用率降了下来，恢复了正常状态。

4. 调试最优解的 jvm 配置

　　获取java -jar 服务启动的进程，再使用 jinfo 命令查看JVM 默认的配置，并修改以上jvm 的配置。我们服务器内存均为 32G，默认最大堆内存为服务器内存的四分之一，即最大堆内存为 8G 。其余参数可根据最大堆内存进行推算出来，通常初始化内存与最大堆内存使用相同的配置。整个堆大小=年轻代大小 + 年老代大小 + 持久代大小。持久代一般固定大小为64m，所以增大年轻代后，将会减小年老代大小。-Xmn 此值对系统性能影响较大，Sun官方推荐配置为整个堆的3/8。年轻代大小为 3G; 修改后的 jvm 配置参数如下：

-Xmn3072m -Xms8192m -Xmx8192m -XX:NewSize=3072M -XX:MaxNewSize=3072M -XX:-UseAdaptiveSizePlicy 
-XX:ParallelGCThreads=16 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:MaxTenuringThreshold=15

　　补充：为了调试出相对比较好的jvm配置，将最大堆内存进行了多个配置对比，即从最大堆配置的值依次递增和递减 512M 之后，观察性能，发现默认配置依然最优解，所以才用默认配置作为服务启动的jvm配置

标签: JVM

FGC频繁导致CPU 飙升定位及JVM配置优化总结

1. 定位消耗cpu 的服务进程和线程

2. 定位FGC 的原因

3. 定位jvm 参数是否导致FGC

4. 调试最优解的 jvm 配置

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

FGC频繁导致CPU 飙升定位及JVM配置优化总结

1. 定位消耗cpu 的服务进程和线程

2. 定位FGC 的原因

3. 定位jvm 参数是否导致FGC

4. 调试最优解的 jvm 配置

热门文章

最新文章

相关电子书