JVM内存机制与常见问题排查

简介: Java内存模型:Java Memory Model,简称JMM。 整体上,JVM内存包含堆内存和线程栈内存,原始数据类型和对象引用在栈内存上,对象(及其成员变量)、静态变量都在堆内存上。堆内存上的所有对象,可以被所有线程拿到,属于共享区域。大部分时候,我们处理的都是堆内存上的问题。

Java内存模型:Java Memory Model,简称JMM。整体上,JVM内存包含堆内存和线程栈内存,原始数据类型和对象引用在栈内存上,对象(及其成员变量)、静态变量都在堆内存上。堆内存上的所有对象,可以被所有线程拿到,属于共享区域。大部分时候,我们处理的都是堆内存上的问题。

JVM堆内存.png

JVM的GC(垃圾回收)采用分代机制,即堆内存分为年轻代、老年代,年轻代里面继续分三块:新生代(Eden-Space)、两个存活区(S0、S1)。GC的大致过程是:创建对象时会在Eden区分配内存,GC的时Eden区和S区(S0和S1中非空的那个)中存活的对象复制到另外一个空的S区。S0和S1在任何时候都有一个空区域专门存储被年轻代GC后仍然存活的对象,这批对象在S0和S1中来回复制多次,最终达到一定存活时间的对象,被移到老年代。

在默认情况下,Eden:S0:S1的内存分配比例是:8:1:1。之所以来回复制,主要是为了解决GC后的内存碎片问题。

JVM采用的GC算法是:标记清除算法(Mark and Sweep)。

  1. 标记:会遍历所有可达对象,这个阶段会让所有应用程序的线程暂停,导致STW停顿问题(Stop The
    World);
  2. 清除:不可达对象占用的内存被回收,以便重用;

JVM调优,很大程度上是GC的调优,下面我们先看看GC相关的知识点。为了方便后面做演示,我们新建一个Java工程(过程略)。

我们可以先来一段耗内存的代码:

List<Order> orderList=new ArrayList<>();
   while(true){
   Order order=new Order();
   order.setId(1);
   order.setName("Java In Action");
   order.setPrice(20.5);
   orderList.add(order);
   System.out.println( "Hello World!"+order);
  }

工程建议加上以下依赖,演示的时候会达成jar包,并用命令行执行:

<plugins>
      <plugin>
        <groupId>org.apache.maven.plugins</groupId>
        <artifactId>maven-jar-plugin</artifactId>
        <configuration>
          <archive>
            <manifest>
              <mainClass>com.learn.performance.MainApp</mainClass>
            </manifest>
          </archive>
        </configuration>
      </plugin>
    </plugins>

打包之后,在Linux上启动运行,笔者这里采用CentOS。下面我们看看怎么查看GC信息。

首先使用jps查看当前进程ID:
jps.png

然后使用jstat查看GC情况:

jstat -gcutil 进程ID 间隔时间

gc.jpg

解释:

S0: 新生代中Survivor space 0区已使用空间的百分比

S1: 新生代中Survivor space 1区已使用空间的百分比

E: 新生代已使用空间的百分比

O: 老年代已使用空间的百分比

M: 永久带已使用空间的百分比

YGC: 从应用程序启动到当前,发生Yang GC 的次数

YGCT: 从应用程序启动到当前,Yang GC所用的时间

FGC: 从应用程序启动到当前,发生Full GC的次数

FGCT: 从应用程序启动到当前,Full GC所用的时间

GCT: 从应用程序启动到当前,用于垃圾回收的总时间

当E和O区占比一直偏大,GC频繁时,就要开始注意系统的内存问题了。前面我们也提到过,GC时,会导致系统卡顿(STW),此时就必须要考虑调优了。

使用jstat查看GC,很多时候是为了线上快速定位问题。而在实际场景中,我们通常会考虑在整个运行阶段都将GC信息打到日志里面,等到出问题后,可以让运维拉日志排查问题。

要实现这个效果,需要新增启动命令-XX:+PrintGCDetails,它可以帮助打印GC细节,然后通过-Xloggc指定GC日志的输出文件。其中%p是进程ID的占位符:

java -XX:+PrintGCDetails -Xloggc:log/gc_%p.log  -jar PerformanceDemo-1.0.jar

这样,最终会在log目录下生成gc_[进程ID].log文件。在GC文件里面,大家可以看到一些默认的配置,比如初始化堆内存、最大堆内存、GC算法(UseParallelGC)假如想知道GC发生的时间,还可以加上-XX:+PrintGCDateStamps参数。

在实际场景中,我们会在启动时指定内存参数,比如:

java -Xmn80m -Xms200m -Xmx200m  -XX:+PrintGCDetails -XX:+PrintGCDateStamps  -Xloggc:log/gc_%p.log  -jar PerformanceDemo-1.0.jar

解释:

  • -Xmn 设置年轻代大小
  • -Xms 设置初始内存,此值可以和-Xmx一样
  • -Xmx 设置JVM最大可用内存

启动后,我们可以使用jmap命令查看内存使用情况:

jmap -heap 进程id

jmap.png

一旦发现堆内存占用比过大时,我们就需要搞清楚到底是哪些对象导致的,此时可以继续使用jmap命令来查看存活对象数量和大小:

jmap -histo:live 进程ID > jmapinfo

此时会把存活对象信息打到jmapinfo这个文件里面,我们可以打开文件看下:

heaplive.jpg

可以很明显看出,我们自定义的Order对象是最多的(Double作为Order的属性之一)。这实际上就是调优的依据之一。

当系统真正出现OOM的时候,可能就直接挂了,这个时候我们是没办法使用jmap命令的,那怎么办呢?在生产环境中,我们通常会做OOM后生产内存dump文件的配置,新增的命令参数如下:

-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=log/heapdump.hprof

此时一旦OOM,会自动将当时的内存信息打到heapdump.hprof文件中,我们可以下载到本地,使用JDK自带的jvisualvm工具打开查看,效果如下:

jdump.jpg

目录
相关文章
|
Arthas 存储 算法
深入理解JVM,包含字节码文件,内存结构,垃圾回收,类的声明周期,类加载器
JVM全称是Java Virtual Machine-Java虚拟机JVM作用:本质上是一个运行在计算机上的程序,职责是运行Java字节码文件,编译为机器码交由计算机运行类的生命周期概述:类的生命周期描述了一个类加载,使用,卸载的整个过类的生命周期阶段:类的声明周期主要分为五个阶段:加载->连接->初始化->使用->卸载,其中连接中分为三个小阶段验证->准备->解析类加载器的定义:JVM提供类加载器给Java程序去获取类和接口字节码数据类加载器的作用:类加载器接受字节码文件。
1013 55
|
Arthas 监控 Java
Arthas memory(查看 JVM 内存信息)
Arthas memory(查看 JVM 内存信息)
1027 6
|
8月前
|
存储 缓存 Java
我们来说一说 JVM 的内存模型
我是小假 期待与你的下一次相遇 ~
535 5
|
8月前
|
存储 缓存 算法
深入理解JVM《JVM内存区域详解 - 世界的基石》
Java代码从编译到执行需经javac编译为.class字节码,再由JVM加载运行。JVM内存分为线程私有(程序计数器、虚拟机栈、本地方法栈)和线程共享(堆、方法区)区域,其中堆是GC主战场,方法区在JDK 8+演变为使用本地内存的元空间,直接内存则用于提升NIO性能,但可能引发OOM。
|
缓存 并行计算 PyTorch
PyTorch CUDA内存管理优化:深度理解GPU资源分配与缓存机制
本文深入探讨了PyTorch中GPU内存管理的核心机制,特别是CUDA缓存分配器的作用与优化策略。文章分析了常见的“CUDA out of memory”问题及其成因,并通过实际案例(如Llama 1B模型训练)展示了内存分配模式。PyTorch的缓存分配器通过内存池化、延迟释放和碎片化优化等技术,显著提升了内存使用效率,减少了系统调用开销。此外,文章还介绍了高级优化方法,包括混合精度训练、梯度检查点技术及自定义内存分配器配置。这些策略有助于开发者在有限硬件资源下实现更高性能的深度学习模型训练与推理。
2374 0
|
12月前
|
缓存 监控 Java
说一说 SpringCloud Gateway 堆外内存溢出排查
我是小假 期待与你的下一次相遇 ~
1446 5
|
存储 缓存 算法
JVM简介—1.Java内存区域
本文详细介绍了Java虚拟机运行时数据区的各个方面,包括其定义、类型(如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区和直接内存)及其作用。文中还探讨了各版本内存区域的变化、直接内存的使用、从线程角度分析Java内存区域、堆与栈的区别、对象创建步骤、对象内存布局及访问定位,并通过实例说明了常见内存溢出问题的原因和表现形式。这些内容帮助开发者深入理解Java内存管理机制,优化应用程序性能并解决潜在的内存问题。
757 29
JVM简介—1.Java内存区域
|
缓存 监控 算法
JVM简介—2.垃圾回收器和内存分配策略
本文介绍了Java垃圾回收机制的多个方面,包括垃圾回收概述、对象存活判断、引用类型介绍、垃圾收集算法、垃圾收集器设计、具体垃圾回收器详情、Stop The World现象、内存分配与回收策略、新生代配置演示、内存泄漏和溢出问题以及JDK提供的相关工具。
JVM简介—2.垃圾回收器和内存分配策略
|
Java 关系型数据库 MySQL
JVM深入原理(六)(二):双亲委派机制
自定义类加载器打破双亲委派机制的方法:复写ClassLoader中的loadClass方法常见问题:要加载的类名如果是以java.开头,则会抛出安全性异常加载自定义的类都会有一个共同的父类Object,需要在代码中交由父类加载器去加载自定义类加载器不手动指定parent会默认指定应用类加载两个自定义类加载器加载同一个类会被认为是两个对象,只有相同的类加载器+想通的类限定名才会被认为是一个对象。
413 0