5G最大堆内存的JVM进程占满云主机8G内存该何去何从(一)

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 一步一步的将理论用于实战,JVM,原来如此深不见底~

背景

运维反馈,经常接到有Java进程内存占用云主机实例93%的告警,当内存持续增高,云主机会对Java进行重启,这也会影响现行业务,对实际服务有所影响。查看服务启动参数后发现最大堆内存为5G,但常常增长到7个多G,到最后出现告警及自动重启的情况,疑惑为什么之前没有类似情况暴露,回忆了下,新业务多数在此应用上开发,有进1个月的时间每天重启,导致问题来不及暴露,不禁为此展开了对该服务与JVM的研究与探讨。

排查

项目背景

项目使用openjdk8,框架为spring boot,由于该Java进程本身启动参数只设置了堆内存大小,及元空间大小,没有指定垃圾回收器也就是hotspot默认的parallel scavenge/parallel old,该GC以吞吐量优先著称,适合不需要太多交互的任务,并不适合该服务,并且gc日志的输出参数在jar 包后,被认为是spring boot项目的参数,未被认为是JVM的参数 ,因此先修复gc日志的输出,以及当oom时输出dump文件,由于直接dump进程的堆内存是对业务有影响的,而且无法自己亲自操作服务器,所以没有选择直接dump JVM的堆。

原来的启动参数如下:

java-XX:MetaspaceSize=512m-XX:MaxMetaspaceSize=512m-Xms5G-Xmx5G-Xmn2G-server-jar/home/active.jar--spring.profiles.active=prod-Xloggc:/home/logs/activegc.log-XX:+UseGCLogFileRotation-XX:NumberOfGCLogFiles=5-XX:GCLogFileSize=20M-XX:+PrintGCDetails-XX:+PrintGCDateStamps-XX:+PrintGCCause

初次修改

在垃圾收集器的选择上,我们选择一台服务器使用默认的, 一台使用cms垃圾收集器,之后基于gc日志来分析堆内存是否有问题。

#主机一使用-XX:+UseConcMarkSweepGCcms垃圾处理器java-XX:MetaspaceSize=512m-XX:MaxMetaspaceSize=512m-Xms5G-Xmx5G-Xmn2G-XX:+UseConcMarkSweepGC-Xloggc:/home/logs/activegc.log-XX:+UseGCLogFileRotation-XX:NumberOfGCLogFiles=5-XX:GCLogFileSize=100M-XX:+PrintGCDetails-XX:+PrintGCDateStamps-XX:+PrintGCCause-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=/home/logs/-server-jar/home/active.jar--spring.profiles.active=prod#主机二使用默认垃圾收集器java-XX:MetaspaceSize=512m-XX:MaxMetaspaceSize=512m-Xms5G-Xmx5G-Xmn2G-Xloggc:/home/logs/activegc.log-XX:+UseGCLogFileRotation-XX:NumberOfGCLogFiles=5-XX:GCLogFileSize=100M-XX:+PrintGCDetails-XX:+PrintGCDateStamps-XX:+PrintGCCause-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=/home/logs/-server-jar/home/active.jar--spring.profiles.active=prod

当默认垃圾收集器对应的Java进程触发告警时,到处gc日志,进行分析

image.png

使用cms垃圾收集器分析gc日志

image.png

以上使用的gc日志分析工具为https://gceasy.io/ 从两个日志分析来看,堆内存是比较健康的,同一时间启动以来,发现默认的垃圾收集器对内存的使用上来说是比较重的,那么我们从而得到一个简单的结论就是可以直接用cms 垃圾收集器来替换,这样可以延缓内存增速飞快导致触发告警并重启。从cms 的日志来看,老年代的内存可以少给一些,因为触发告警了需要手动重启,正好修改一下cms 垃圾收集器的java进程的内存分配,看cms进程内存的利用率并不是很高,所以替换默认垃圾收集器,使用G1看看是否更有效果。

总结

当默认的垃圾收集器触发告警时,cms 垃圾收集器内存对应的云主机内存使用率为60%,前途一片光明,战斗取得了阶段性胜利,但并不能止步,还需要进一步的研究与探索,堆内存如此健康,到底是怎么占满了8G内存的呢?

敬请期待。。。

大家加油!!!

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
6月前
|
Arthas 存储 算法
深入理解JVM,包含字节码文件,内存结构,垃圾回收,类的声明周期,类加载器
JVM全称是Java Virtual Machine-Java虚拟机JVM作用:本质上是一个运行在计算机上的程序,职责是运行Java字节码文件,编译为机器码交由计算机运行类的生命周期概述:类的生命周期描述了一个类加载,使用,卸载的整个过类的生命周期阶段:类的声明周期主要分为五个阶段:加载->连接->初始化->使用->卸载,其中连接中分为三个小阶段验证->准备->解析类加载器的定义:JVM提供类加载器给Java程序去获取类和接口字节码数据类加载器的作用:类加载器接受字节码文件。
615 55
|
30天前
|
存储 缓存 Java
我们来说一说 JVM 的内存模型
我是小假 期待与你的下一次相遇 ~
193 4
|
1月前
|
存储 缓存 算法
深入理解JVM《JVM内存区域详解 - 世界的基石》
Java代码从编译到执行需经javac编译为.class字节码,再由JVM加载运行。JVM内存分为线程私有(程序计数器、虚拟机栈、本地方法栈)和线程共享(堆、方法区)区域,其中堆是GC主战场,方法区在JDK 8+演变为使用本地内存的元空间,直接内存则用于提升NIO性能,但可能引发OOM。
|
7月前
|
Arthas 监控 Java
Arthas memory(查看 JVM 内存信息)
Arthas memory(查看 JVM 内存信息)
602 6
|
10月前
|
存储 设计模式 监控
快速定位并优化CPU 与 JVM 内存性能瓶颈
本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。
1025 166
|
8月前
|
存储 缓存 算法
JVM简介—1.Java内存区域
本文详细介绍了Java虚拟机运行时数据区的各个方面,包括其定义、类型(如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区和直接内存)及其作用。文中还探讨了各版本内存区域的变化、直接内存的使用、从线程角度分析Java内存区域、堆与栈的区别、对象创建步骤、对象内存布局及访问定位,并通过实例说明了常见内存溢出问题的原因和表现形式。这些内容帮助开发者深入理解Java内存管理机制,优化应用程序性能并解决潜在的内存问题。
380 29
JVM简介—1.Java内存区域
|
8月前
|
缓存 监控 算法
JVM简介—2.垃圾回收器和内存分配策略
本文介绍了Java垃圾回收机制的多个方面,包括垃圾回收概述、对象存活判断、引用类型介绍、垃圾收集算法、垃圾收集器设计、具体垃圾回收器详情、Stop The World现象、内存分配与回收策略、新生代配置演示、内存泄漏和溢出问题以及JDK提供的相关工具。
JVM简介—2.垃圾回收器和内存分配策略
|
8月前
|
存储 设计模式 监控
如何快速定位并优化CPU 与 JVM 内存性能瓶颈?
如何快速定位并优化CPU 与 JVM 内存性能瓶颈?
228 0
如何快速定位并优化CPU 与 JVM 内存性能瓶颈?
|
9月前
|
存储 算法 Java
JVM: 内存、类与垃圾
分代收集算法将内存分为新生代和老年代,分别使用不同的垃圾回收算法。新生代对象使用复制算法,老年代对象使用标记-清除或标记-整理算法。
139 6
|
11月前
|
存储 Java 程序员
【JVM】——JVM运行机制、类加载机制、内存划分
JVM运行机制,堆栈,程序计数器,元数据区,JVM加载机制,双亲委派模型
308 10

热门文章

最新文章