【1】对象创建的过程
当虚拟机遇到一条含有“new”
的指令时,会进行一系列对象创建的操作。
① 检查常量池中是否有即将要创建的这个对象所属的类的符号引用
若常量池中没有这个类的符号引用,说明这个类还没有被定义,抛出ClassNotFoundException。
若常量池中有这个类的符号引用,则进行下一步工作。
② 检查这个符号引用所代表的类是否已经被JVM加载
若该类还没有被加载,就找到该类的class文件
,并加载进方法区
。
若该类已经被JVM加载,则准备为对象分配内存。
③ 根据方法区中该类的信息确定该类所需的内存大小
一个对象所需内存大小是在这个对象所属类被定义完就能确定的。且一个类所生产的所有对象的内存大小是一样的。JVM在一个类被加载进方法区的时候就知道该类生产的每一个对象所需要的内存大小。
④ 从堆中划分一块对应大小的内存空间给新的对象
分配堆中内存有两种方式:指针碰撞和空闲列表
指针碰撞
如果JVM的垃圾收集器采用复制算法
或标记-整理
算法,那么堆中空闲内存是完整区域
,并且空闲内存和已使用内存之间由一个指针标记
。
那么当为一个对象分配内存时,只需移动指针即可。因此,这种在完整空闲区域上通过移动指针来分配内存的方式就叫做“指针碰撞”。
空闲列表
如果JVM的垃圾收集器采用标记-清除算法,那么堆中空闲区域和已使用区域交错。
因此需要用一张“空闲列表”来记录堆中哪些区域是空闲区域,从而在创建对象的时候根据这张“空闲列表”找到空闲区域,并分配内存。
新生代中使用“复制”算法实现垃圾回收,老年代中使用“标记-清除”或“标记-整理”算法实现垃圾回收。
故而新生代使用指针碰撞内存分配方法,老年代可能使用指针碰撞或者空闲列表内存分配方法。
综上所述,JVM采用哪种内存分配方法,取决于它使用了何种垃圾收集器。
⑤ 为对象中的成员变量赋上初始值(默认初始化)
静态变量和常量(如果有初始值)在类加载过程中就已经初始化了,在编译的时候存储在class的常量池中,在加载后又被放进方法区的运行时常量池中。
也就是说无论是静态变量还是常量,其初始化均在构造函数方法执行前
普通成员变量如果有初始值,则赋值初始值,如int i=5;;如果没有初始值,则赋值默认值, 如 int i。前者如果使用无参构造函数则对象中 i 为5,后者 i 为 0。
⑥ 设置对象头中的信息
对象头在32位系统上占用8bytes,64位系统上占用16bytes。
⑦ 调用对象的构造函数进行初始化
如果是无参构造函数,则对象的成员变量值依据于第⑤步中的值;如果是有参构造函数,则对象的成员变量值会随着参数值发生变动。
此时整个对象的创建过程就完成了。
【2】对象的内存模型
一个对象从逻辑角度看,它由成员变量和成员函数构成。从物理角度看,对象是存储在堆堆中的一串二进制数,这串二进制数的组织结构如下。
对象在内存中分为三个部分:
- 对象头
- 实例数据
- 对齐补充
① 对象头
对象头中记录了对象在运行过程中所需要使用的一些数据:哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
此外,对象头中可能还包含类型指针,通过该指针能确定该对象所属哪个类。
此外,如果对象是一个数组,那么对象头中还要包含数组长度。
普通对象头在32位系统上占用8bytes,64位系统上占用16bytes。
64位机器上,数组对象的对象头占用24个字节,启用压缩之后占用16个字节。
计算公式:
Class 模板对象头 = Mark World(1字宽)+Class Metadata Address(1字宽) + Array length(1字宽)[如果存在数组]; 字宽就是字长,32位机上一个字长32位,64位机上一个字长64位。
② 实例数据
实例数据部分就是成员变量的值,其中包含父类的成员变量和本类的成员变量。
也就是说,除去静态变量和常量值放在方法区(实现是永久代和元空间)
,非静态变量的值是随着对象存储在堆中的。
因为修改静态变量会反映到方法区中class的数据结构中,故而推测对象保存的是静态变量和常量的引用。
③ 对齐补充
用于确保对象的总长度为8字节的整数倍,HotSpot要求对象的总长度必须是8字节的整数倍。
由于对象头一定是8字节的整数倍,但实例数据部分的长度是任意的。因此需要对齐补充字段确保整个对象的总长度为8的整数倍。
(对象头 + 实例数据 + padding) % 8等于0,且0 <= padding < 8
【3】访问对象的过程
我们知道,引用类型的变量中存放的是一个地址,那么根据地址类型的不同,对象有不同的访问方式。
① 句柄访问方式
堆中需要有一块叫做“句柄池”
的内存空间,用于存放所有对象的地址
和所有对象所属类的类信息
。
引用类型的变量存放的是该对象在句柄池中的句柄地址
。访问对象时,首先需要通过引用类型的变量找到该对象的句柄,然后根据句柄中对象的地址再访问对象。
② 直接指针访问方式
引用类型的变量直接存放对象的地址
,从而不需要句柄池,通过引用能够直接访问对象。但对象所在的内存空间中需要额外的策略存储对象所属的类信息的地址。
reference存储的直接就是对象地址,速度快,节省了一次指针定位的开销。java中对象的访问特别多,所以在java中该方式使用的最多。
HotSpot采用直接指针方式访问对象
,因为它只需一次寻址操作,从而性能比句柄访问方式快一倍。但它需要额外的策略存储对象在方法区中类信息的地址。