JVM 内存分配机制
一、JVM 对象创建过程
1. 类加载检查
虚拟机遇到一条 new 指令时,首先会检查这个指令的参数能否在常量池里面定位到一个类的符号引用,并且检查这个符号引用代表的类是否被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
new 指令对应到语言层面上讲的是,new 关键字、对象克隆、对象序列化等。
2. 内存分配
在类加载检查通过过后,接下来对象将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定,为对象分空间的任务等同于把一块确定大小的内存从 Java 堆中划分出来。
这个步骤需要解决两个问题:
- 如何换分内存。
- 在并发情况下, 可能出现正在给对象 A 分配内存,指针还没有来得及修改,对象 B 又同时使用来原来的指针来分配内存的情况。
划分内存的方法
- “指针碰撞” (Bump the Pointer ) (默认使用指针碰撞)。 如果 Java 堆中内存是绝对规整的,所有用过的内存在一边,空闲的内存在另外一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把哪个指针指向空闲空间挪动一段对象大小相等的距离
- “空闲列表” (Free List)如果 Java 堆中的空间并不是规整的,已使用的内存空间和空闲的内存空间相互交错,那么就没有办法简单的进行指针碰撞了,虚拟机就需要维护一个列表,记录那些内存是使用过的,那些是没有使用过的。
3.解决并发问题
- CAS (compare and swap), 虚拟机采用 CAS 并发分配重试的方式保证更新操作的原子性来堆分配内存空间的动作进行同步处理。
- 本地线程分配缓冲(Thread Local Allocation Buffer, TLAB),把内存分配的动作按照线程不同的空间中进行,即每个线程在 Java 堆中预先分配一小块内存。通过
-XX:+/-UseTLAB
参数来设定虚拟机是否使用 TLAB (Jvm 会默认开启-XX:+UseTLAB
), 通过-XX:TLABSize
指定 TLAB 大小。
4. 初始化
内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),如果使用 TLAB , 这一工作也可以提前 TLAB 分配进行。这一步骤保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用,程序能访问这些字段的数据类型对应的零值。
5. 设置对象头
初始化零值分配后,虚拟机要进行必要的设置,例如设置这个对象是哪个实例,如何能够得到类的元数据信息、对象的哈希码、对象的 GC 分代年龄等信息,这些信息都存放在对象头(Object Header)中。
在 HotSpot 虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
HotSpot虚拟机对象的对象头部分包括两类信息。第一类是用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。对象头的另外一部分是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。
对象头在 hotspot 虚拟机中的源码 markOop.cpp
// Bit-format of an object header (most significant first, big endian layout below): // // 32 bits: // -------- // hash:25 ------------>| age:4 biased_lock:1 lock:2 (normal object) // JavaThread*:23 epoch:2 age:4 biased_lock:1 lock:2 (biased object) // size:32 ------------------------------------------>| (CMS free block) // PromotedObject*:29 ---------->| promo_bits:3 ----->| (CMS promoted object) // // 64 bits: // -------- // unused:25 hash:31 -->| unused:1 age:4 biased_lock:1 lock:2 (normal object) // JavaThread*:54 epoch:2 unused:1 age:4 biased_lock:1 lock:2 (biased object) // PromotedObject*:61 --------------------->| promo_bits:3 ----->| (CMS promoted object) // size:64 ----------------------------------------------------->| (CMS free block) // // unused:25 hash:31 -->| cms_free:1 age:4 biased_lock:1 lock:2 (COOPs && normal object) // JavaThread*:54 epoch:2 cms_free:1 age:4 biased_lock:1 lock:2 (COOPs && biased object) // narrowOop:32 unused:24 cms_free:1 unused:4 promo_bits:3 ----->| (COOPs && CMS promoted object) // unused:21 size:35 -->| cms_free:1 unused:7 ------------------>| (COOPs && CMS free block)
6. 调用 <init>
方法
执行 <init>
方法, 即按照程序开发者的意愿进行初始化。对应到语言的层面上来说,就是为属性赋值(注意,这上面的赋零值不同,这是由程序开发者赋的值)和执行构造方法。
二、对象大小与指针压缩
对象的结构我们可以通过 org.openjdk.jol:jol-core
打印内存的布局信息
maven 依赖代码:
<dependency> <groupId>org.openjdk.jol</groupId> <artifactId>jol-core</artifactId> <version>0.9</version> </dependency>
测试代码
public class ClassLayoutTest { public static void main(String[] args) { ClassLayout layout1 = ClassLayout.parseInstance(new Object()); System.out.println(layout1.toPrintable()); System.out.println(); ClassLayout layout2 = ClassLayout.parseInstance(new int[]{}); System.out.println(layout2.toPrintable()); System.out.println(); ClassLayout layout3 = ClassLayout.parseInstance(new A()); System.out.println(layout3.toPrintable()); } //-XX:+UseCompressedOops 默认开启的压缩所有指针 //-XX:+UseCompressedClassPointers 默认开启的只压缩对象头里的类型指针 Klass Pointer //Oops: Ordinary Object Pointers public static class A { //8B mark word //4B Klass Pointer 如果关闭 -XX:-UseCompressedClassPointers 或者 -XX:-UseCompressedOops, 则占 8个字节 int id; //4B String name; //4B 如果关闭 -XX:-UseCompressedOops, 则占 8个字节 byte b; //1B Object o; //4B 如果关闭 -XX:-UseCompressedOops, 则占 8个字节 } }
输出结果
java.lang.Object object internals: OFFSET SIZE TYPE DESCRIPTION VALUE 0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1) 4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0) 8 4 (object header) e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243) 12 4 (loss due to the next object alignment) // 对齐填充 Instance size: 16 bytes Space losses: 0 bytes internal + 4 bytes external = 4 bytes total [I object internals: OFFSET SIZE TYPE DESCRIPTION VALUE 0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1) 4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0) 8 4 (object header) 6d 01 00 f8 (01101101 00000001 00000000 11111000) (-134217363) 12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0) 16 0 int [I.<elements> N/A Instance size: 16 bytes Space losses: 0 bytes internal + 0 bytes external = 0 bytes total com.jvm.ClassLayoutTest$A object internals: OFFSET SIZE TYPE DESCRIPTION VALUE 0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1) 4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0) 8 4 (object header) 57 e0 00 f8 (01010111 11100000 00000000 11111000) (-134160297) 12 4 int A.id 0 16 4 java.lang.String A.name null 20 4 java.lang.Object A.object null Instance size: 24 bytes Space losses: 0 bytes internal + 0 bytes external = 0 bytes total
什么是 Java 对象的指针压缩?
- jdk1.6 update14开始, 在 64bit操作系统中, JVM 支持指针压缩
- jvm配置参数: UseCompressedOops, compressed--压缩、oop( ordinary object pointer)-对象指针
- 启用指针压缩: -XX:+UseCompressedOops(默认开启), 禁止指针压缩: -XX:-UseCompressedOops
为什么要进行指针压缩?
- 在 64 位平台的 Hotspot 中使用 32 位指针(实际存储用64位)内存使用会多出1.5倍左右, 使用较大指针在主内存和缓存之间移动数据, 占用较大宽带, 同时GC也会承受较大压力。
- 为了减少64位平台下内存的消耗, 启用指针压缩功能
- 在jvm中, 32 位地址最大支持4G内存(2的32次方), 可以通过对对象指针的存入堆内存时压缩编码、取出到cpu寄存器后解码方式进行优化(对象指针在堆中是32位,在寄存器中是35位,2的35次方=32G), 使得jvm只用32位地址就可以支持更大的内存配置(小于等于32G)
- 堆内存小于 4G 时,不需要启用指针压缩, jvm 会直接去除高 32 位地址, 即使用低虚拟地址空间
- 堆内存大于 32G 时压指针会生效会强制使用64位(即8字节)来对 Java 象寻址,这就会出视1的问题,所以堆内存不要大于 32G 为好。
关于对齐填充: 对于大部分处理器,对象以 8 字节整数倍来对齐填充都是最高效的存取方式。
三、JVM 对象内存分配过程