5G最大堆内存的JVM进程占满云主机8G内存该何去何从(一)

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 一步一步的将理论用于实战,JVM,原来如此深不见底~

背景

运维反馈,经常接到有Java进程内存占用云主机实例93%的告警,当内存持续增高,云主机会对Java进行重启,这也会影响现行业务,对实际服务有所影响。查看服务启动参数后发现最大堆内存为5G,但常常增长到7个多G,到最后出现告警及自动重启的情况,疑惑为什么之前没有类似情况暴露,回忆了下,新业务多数在此应用上开发,有进1个月的时间每天重启,导致问题来不及暴露,不禁为此展开了对该服务与JVM的研究与探讨。

排查

项目背景

项目使用openjdk8,框架为spring boot,由于该Java进程本身启动参数只设置了堆内存大小,及元空间大小,没有指定垃圾回收器也就是hotspot默认的parallel scavenge/parallel old,该GC以吞吐量优先著称,适合不需要太多交互的任务,并不适合该服务,并且gc日志的输出参数在jar 包后,被认为是spring boot项目的参数,未被认为是JVM的参数 ,因此先修复gc日志的输出,以及当oom时输出dump文件,由于直接dump进程的堆内存是对业务有影响的,而且无法自己亲自操作服务器,所以没有选择直接dump JVM的堆。

原来的启动参数如下:

java-XX:MetaspaceSize=512m-XX:MaxMetaspaceSize=512m-Xms5G-Xmx5G-Xmn2G-server-jar/home/active.jar--spring.profiles.active=prod-Xloggc:/home/logs/activegc.log-XX:+UseGCLogFileRotation-XX:NumberOfGCLogFiles=5-XX:GCLogFileSize=20M-XX:+PrintGCDetails-XX:+PrintGCDateStamps-XX:+PrintGCCause

初次修改

在垃圾收集器的选择上,我们选择一台服务器使用默认的, 一台使用cms垃圾收集器,之后基于gc日志来分析堆内存是否有问题。

#主机一使用-XX:+UseConcMarkSweepGCcms垃圾处理器java-XX:MetaspaceSize=512m-XX:MaxMetaspaceSize=512m-Xms5G-Xmx5G-Xmn2G-XX:+UseConcMarkSweepGC-Xloggc:/home/logs/activegc.log-XX:+UseGCLogFileRotation-XX:NumberOfGCLogFiles=5-XX:GCLogFileSize=100M-XX:+PrintGCDetails-XX:+PrintGCDateStamps-XX:+PrintGCCause-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=/home/logs/-server-jar/home/active.jar--spring.profiles.active=prod#主机二使用默认垃圾收集器java-XX:MetaspaceSize=512m-XX:MaxMetaspaceSize=512m-Xms5G-Xmx5G-Xmn2G-Xloggc:/home/logs/activegc.log-XX:+UseGCLogFileRotation-XX:NumberOfGCLogFiles=5-XX:GCLogFileSize=100M-XX:+PrintGCDetails-XX:+PrintGCDateStamps-XX:+PrintGCCause-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=/home/logs/-server-jar/home/active.jar--spring.profiles.active=prod

当默认垃圾收集器对应的Java进程触发告警时,到处gc日志,进行分析

image.png

使用cms垃圾收集器分析gc日志

image.png

以上使用的gc日志分析工具为https://gceasy.io/ 从两个日志分析来看,堆内存是比较健康的,同一时间启动以来,发现默认的垃圾收集器对内存的使用上来说是比较重的,那么我们从而得到一个简单的结论就是可以直接用cms 垃圾收集器来替换,这样可以延缓内存增速飞快导致触发告警并重启。从cms 的日志来看,老年代的内存可以少给一些,因为触发告警了需要手动重启,正好修改一下cms 垃圾收集器的java进程的内存分配,看cms进程内存的利用率并不是很高,所以替换默认垃圾收集器,使用G1看看是否更有效果。

总结

当默认的垃圾收集器触发告警时,cms 垃圾收集器内存对应的云主机内存使用率为60%,前途一片光明,战斗取得了阶段性胜利,但并不能止步,还需要进一步的研究与探索,堆内存如此健康,到底是怎么占满了8G内存的呢?

敬请期待。。。

大家加油!!!

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
10天前
堆内存
1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。
12 5
|
7天前
|
存储 算法 Java
JVM自动内存管理之垃圾收集算法
文章概述了JVM内存管理和垃圾收集的基本概念,提供一个关于JVM内存管理和垃圾收集的基础理解框架。
JVM自动内存管理之垃圾收集算法
|
7天前
|
存储 Java 程序员
JVM自动内存管理之运行时内存区
这篇文章详细解释了JVM运行时数据区的各个组成部分及其作用,有助于理解Java程序运行时的内存布局和管理机制。
JVM自动内存管理之运行时内存区
|
18天前
|
存储 安全 Java
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程,JDK、JRE、JVM关系;程序计数器,堆,虚拟机栈,堆栈的区别是什么,方法区,直接内存
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程是什么,JDK、JRE、JVM的联系与区别;什么是程序计数器,堆,虚拟机栈,栈内存溢出,堆栈的区别是什么,方法区,直接内存
JVM常见面试题(二):JVM是什么、由哪些部分组成、运行流程,JDK、JRE、JVM关系;程序计数器,堆,虚拟机栈,堆栈的区别是什么,方法区,直接内存
|
4天前
|
JavaScript Java 开发工具
Electron V8排查问题之接近堆内存限制的处理如何解决
Electron V8排查问题之接近堆内存限制的处理如何解决
17 1
|
5天前
堆内存
1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。
15 1
|
11天前
堆内存
1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。
26 7
|
6天前
堆内存
1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。
15 1
|
8天前
堆内存
1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。
18 2
|
14天前
堆内存
1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。规则: 整数 默认是0 浮点 默认0.0 字符 默认'\u0000'
20 2