JVM 内存分配机制,一次讲够!(上)

简介: 本文主要讲述 JVM 内存分配机制细节, 包含如下内容:Java 对象创建过程对象的内存结构和指针压缩对象的内存分配过程逃逸分析内存回收策略4 种引用类型本文所提到的 JVM 分配都是基于 jdk-1.8 版本

JVM 内存分配机制


一、JVM 对象创建过程


image.png


1. 类加载检查


虚拟机遇到一条 new 指令时,首先会检查这个指令的参数能否在常量池里面定位到一个类的符号引用,并且检查这个符号引用代表的类是否被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。


new 指令对应到语言层面上讲的是,new 关键字、对象克隆、对象序列化等。


2. 内存分配


在类加载检查通过过后,接下来对象将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定,为对象分空间的任务等同于把一块确定大小的内存从 Java 堆中划分出来。


这个步骤需要解决两个问题:


  1. 如何换分内存。


  1. 在并发情况下, 可能出现正在给对象 A 分配内存,指针还没有来得及修改,对象 B 又同时使用来原来的指针来分配内存的情况。


划分内存的方法


  1. “指针碰撞” (Bump the Pointer ) (默认使用指针碰撞)。 如果 Java 堆中内存是绝对规整的,所有用过的内存在一边,空闲的内存在另外一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把哪个指针指向空闲空间挪动一段对象大小相等的距离


  1. “空闲列表” (Free List)如果 Java 堆中的空间并不是规整的,已使用的内存空间和空闲的内存空间相互交错,那么就没有办法简单的进行指针碰撞了,虚拟机就需要维护一个列表,记录那些内存是使用过的,那些是没有使用过的。


3.解决并发问题


  1. CAS (compare and swap), 虚拟机采用 CAS 并发分配重试的方式保证更新操作的原子性来堆分配内存空间的动作进行同步处理。


  1. 本地线程分配缓冲(Thread Local Allocation Buffer, TLAB),把内存分配的动作按照线程不同的空间中进行,即每个线程在 Java 堆中预先分配一小块内存。通过-XX:+/-UseTLAB  参数来设定虚拟机是否使用 TLAB (Jvm 会默认开启  -XX:+UseTLAB ), 通过 -XX:TLABSize 指定 TLAB 大小。


4. 初始化


内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),如果使用 TLAB , 这一工作也可以提前 TLAB 分配进行。这一步骤保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用,程序能访问这些字段的数据类型对应的零值。


5. 设置对象头


初始化零值分配后,虚拟机要进行必要的设置,例如设置这个对象是哪个实例,如何能够得到类的元数据信息、对象的哈希码、对象的 GC 分代年龄等信息,这些信息都存放在对象头(Object Header)中。


在 HotSpot 虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。


HotSpot虚拟机对象的对象头部分包括两类信息。第一类是用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。对象头的另外一部分是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。


image.png


对象头在 hotspot 虚拟机中的源码  markOop.cpp


// Bit-format of an object header (most significant first, big endian layout below):
//
//  32 bits:
//  --------
//             hash:25 ------------>| age:4    biased_lock:1 lock:2 (normal object)
//             JavaThread*:23 epoch:2 age:4    biased_lock:1 lock:2 (biased object)
//             size:32 ------------------------------------------>| (CMS free block)
//             PromotedObject*:29 ---------->| promo_bits:3 ----->| (CMS promoted object)
//
//  64 bits:
//  --------
//  unused:25 hash:31 -->| unused:1   age:4    biased_lock:1 lock:2 (normal object)
//  JavaThread*:54 epoch:2 unused:1   age:4    biased_lock:1 lock:2 (biased object)
//  PromotedObject*:61 --------------------->| promo_bits:3 ----->| (CMS promoted object)
//  size:64 ----------------------------------------------------->| (CMS free block)
//
//  unused:25 hash:31 -->| cms_free:1 age:4    biased_lock:1 lock:2 (COOPs && normal object)
//  JavaThread*:54 epoch:2 cms_free:1 age:4    biased_lock:1 lock:2 (COOPs && biased object)
//  narrowOop:32 unused:24 cms_free:1 unused:4 promo_bits:3 ----->| (COOPs && CMS promoted object)
//  unused:21 size:35 -->| cms_free:1 unused:7 ------------------>| (COOPs && CMS free block)


6. 调用 <init> 方法


执行  <init> 方法,  即按照程序开发者的意愿进行初始化。对应到语言的层面上来说,就是为属性赋值(注意,这上面的赋零值不同,这是由程序开发者赋的值)和执行构造方法。


二、对象大小与指针压缩


对象的结构我们可以通过 org.openjdk.jol:jol-core 打印内存的布局信息


maven 依赖代码:


<dependency>
  <groupId>org.openjdk.jol</groupId>
  <artifactId>jol-core</artifactId>
  <version>0.9</version>
</dependency>


测试代码


public class ClassLayoutTest {
    public static void main(String[] args) {
        ClassLayout layout1 = ClassLayout.parseInstance(new Object());
        System.out.println(layout1.toPrintable());
        System.out.println();
        ClassLayout layout2 = ClassLayout.parseInstance(new int[]{});
        System.out.println(layout2.toPrintable());
        System.out.println();
        ClassLayout layout3 = ClassLayout.parseInstance(new A());
        System.out.println(layout3.toPrintable());
    }
    //-XX:+UseCompressedOops          默认开启的压缩所有指针
    //-XX:+UseCompressedClassPointers 默认开启的只压缩对象头里的类型指针 Klass Pointer
    //Oops: Ordinary Object Pointers
    public static class A {
                        //8B  mark word
                        //4B Klass Pointer 如果关闭 -XX:-UseCompressedClassPointers 或者 -XX:-UseCompressedOops, 则占 8个字节
        int id;         //4B
        String name;    //4B 如果关闭 -XX:-UseCompressedOops, 则占 8个字节
        byte b;         //1B
        Object o;       //4B 如果关闭 -XX:-UseCompressedOops, 则占 8个字节
    }
}


输出结果


java.lang.Object object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4        (object header)                           e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)
     12     4        (loss due to the next object alignment) // 对齐填充
Instance size: 16 bytes
Space losses: 0 bytes internal + 4 bytes external = 4 bytes total
[I object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4        (object header)                           6d 01 00 f8 (01101101 00000001 00000000 11111000) (-134217363)
     12     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
     16     0    int [I.<elements>                             N/A
Instance size: 16 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total
com.jvm.ClassLayoutTest$A object internals:
 OFFSET  SIZE               TYPE DESCRIPTION                               VALUE
      0     4                    (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)
      4     4                    (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4                    (object header)                           57 e0 00 f8 (01010111 11100000 00000000 11111000) (-134160297)
     12     4                int A.id                                      0
     16     4   java.lang.String A.name                                    null
     20     4   java.lang.Object A.object                                  null
Instance size: 24 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total

什么是 Java 对象的指针压缩?


  1. jdk1.6 update14开始, 在 64bit操作系统中, JVM 支持指针压缩


  1. jvm配置参数: UseCompressedOops, compressed--压缩、oop( ordinary object pointer)-对象指针


  1. 启用指针压缩: -XX:+UseCompressedOops(默认开启), 禁止指针压缩: -XX:-UseCompressedOops

为什么要进行指针压缩?


  1. 在 64 位平台的 Hotspot 中使用 32 位指针(实际存储用64位)内存使用会多出1.5倍左右, 使用较大指针在主内存和缓存之间移动数据, 占用较大宽带, 同时GC也会承受较大压力。


  1. 为了减少64位平台下内存的消耗, 启用指针压缩功能


  1. 在jvm中, 32 位地址最大支持4G内存(2的32次方), 可以通过对对象指针的存入堆内存时压缩编码、取出到cpu寄存器后解码方式进行优化(对象指针在堆中是32位,在寄存器中是35位,2的35次方=32G), 使得jvm只用32位地址就可以支持更大的内存配置(小于等于32G)


  1. 堆内存小于 4G 时,不需要启用指针压缩, jvm 会直接去除高 32 位地址, 即使用低虚拟地址空间


  1. 堆内存大于 32G 时压指针会生效会强制使用64位(即8字节)来对 Java 象寻址,这就会出视1的问题,所以堆内存不要大于 32G 为好。


关于对齐填充: 对于大部分处理器,对象以 8 字节整数倍来对齐填充都是最高效的存取方式。

三、JVM 对象内存分配过程


image.png


相关文章
|
9月前
|
Arthas 存储 算法
深入理解JVM,包含字节码文件,内存结构,垃圾回收,类的声明周期,类加载器
JVM全称是Java Virtual Machine-Java虚拟机JVM作用:本质上是一个运行在计算机上的程序,职责是运行Java字节码文件,编译为机器码交由计算机运行类的生命周期概述:类的生命周期描述了一个类加载,使用,卸载的整个过类的生命周期阶段:类的声明周期主要分为五个阶段:加载->连接->初始化->使用->卸载,其中连接中分为三个小阶段验证->准备->解析类加载器的定义:JVM提供类加载器给Java程序去获取类和接口字节码数据类加载器的作用:类加载器接受字节码文件。
862 55
|
4月前
|
存储 缓存 Java
我们来说一说 JVM 的内存模型
我是小假 期待与你的下一次相遇 ~
402 5
|
10月前
|
Arthas 监控 Java
Arthas memory(查看 JVM 内存信息)
Arthas memory(查看 JVM 内存信息)
839 6
|
4月前
|
存储 缓存 算法
深入理解JVM《JVM内存区域详解 - 世界的基石》
Java代码从编译到执行需经javac编译为.class字节码,再由JVM加载运行。JVM内存分为线程私有(程序计数器、虚拟机栈、本地方法栈)和线程共享(堆、方法区)区域,其中堆是GC主战场,方法区在JDK 8+演变为使用本地内存的元空间,直接内存则用于提升NIO性能,但可能引发OOM。
|
10月前
|
缓存 并行计算 PyTorch
PyTorch CUDA内存管理优化:深度理解GPU资源分配与缓存机制
本文深入探讨了PyTorch中GPU内存管理的核心机制,特别是CUDA缓存分配器的作用与优化策略。文章分析了常见的“CUDA out of memory”问题及其成因,并通过实际案例(如Llama 1B模型训练)展示了内存分配模式。PyTorch的缓存分配器通过内存池化、延迟释放和碎片化优化等技术,显著提升了内存使用效率,减少了系统调用开销。此外,文章还介绍了高级优化方法,包括混合精度训练、梯度检查点技术及自定义内存分配器配置。这些策略有助于开发者在有限硬件资源下实现更高性能的深度学习模型训练与推理。
1990 0
|
存储 设计模式 监控
快速定位并优化CPU 与 JVM 内存性能瓶颈
本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。
1204 166
|
11月前
|
存储 缓存 算法
JVM简介—1.Java内存区域
本文详细介绍了Java虚拟机运行时数据区的各个方面,包括其定义、类型(如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区和直接内存)及其作用。文中还探讨了各版本内存区域的变化、直接内存的使用、从线程角度分析Java内存区域、堆与栈的区别、对象创建步骤、对象内存布局及访问定位,并通过实例说明了常见内存溢出问题的原因和表现形式。这些内容帮助开发者深入理解Java内存管理机制,优化应用程序性能并解决潜在的内存问题。
625 29
JVM简介—1.Java内存区域
|
11月前
|
缓存 监控 算法
JVM简介—2.垃圾回收器和内存分配策略
本文介绍了Java垃圾回收机制的多个方面,包括垃圾回收概述、对象存活判断、引用类型介绍、垃圾收集算法、垃圾收集器设计、具体垃圾回收器详情、Stop The World现象、内存分配与回收策略、新生代配置演示、内存泄漏和溢出问题以及JDK提供的相关工具。
JVM简介—2.垃圾回收器和内存分配策略
|
9月前
|
Java 关系型数据库 MySQL
JVM深入原理(六)(二):双亲委派机制
自定义类加载器打破双亲委派机制的方法:复写ClassLoader中的loadClass方法常见问题:要加载的类名如果是以java.开头,则会抛出安全性异常加载自定义的类都会有一个共同的父类Object,需要在代码中交由父类加载器去加载自定义类加载器不手动指定parent会默认指定应用类加载两个自定义类加载器加载同一个类会被认为是两个对象,只有相同的类加载器+想通的类限定名才会被认为是一个对象。
333 0
|
存储 算法 Java
JVM: 内存、类与垃圾
分代收集算法将内存分为新生代和老年代,分别使用不同的垃圾回收算法。新生代对象使用复制算法,老年代对象使用标记-清除或标记-整理算法。
195 6