对于Java程序员来说,他们相比C++程序员最幸福的一点就是不用自己管理内存,内存的分配和回收都由虚拟机完成。然而,正是由于该原因,一旦虚拟机内存管理出现问题,比如出现内存泄漏或溢出,排查起来将是非常困难的。所以尽管不用亲自动手管理内存,但是了解虚拟机的内存管理机制还是很有必要的。
- 运行时数据区域
首先来看下Java虚拟机在运行时的数据区域划分,Java虚拟机在Java程序运行时会将内存区域划分成若干个不同的区域,各自负责不同的职责。
1.1 程序计数器
程序计数器(PC)的概念比较简单,记录当前程序所执行的指令行号,需要注意的是每个线程各自拥有一个程序计数器,各自记录各自线程的指令执行地址。如果当前线程正在执行一个Java方法,则程序计数器记录的是当前指令地址;如果当前线程执行的是Native方法则程序计数器值为0。
1.2 虚拟机栈
Java虚拟机栈也是线程私有的,用于记录Java方法的内存模型,虚拟机栈可以看做一个容器用于盛放一个个栈帧,每一个方法在开始执行之前都会创建一个栈帧用于存储方法执行期间的局部变量、操作数、动态链接、方法出口等,所以一个方法从调用到返回的过程也可以看成是一个栈帧从入栈到出栈的过程。
当一个方法中调用另一个方法时,Java虚拟机会将被调用方法对应的栈帧压入虚拟机栈顶,当该方法执行完成后该方法出栈,调用方法重新回到栈顶。如果方法调用深度超过了虚拟机规定的最大深度时,将会抛出StackOverflowError。
1.3 本地方法栈
本地方法栈作用和虚拟机栈类似,只是针对的是Native方法而已。
1.4 堆
堆是Java运行时最大的一块空间,Java程序运行时几乎所有创建出来的对象都是在堆区分配的,存储实例数据是堆区唯一的职责。由于用户创建对象几乎全部在堆上,所以垃圾收集器GC的主要工作区域。另外堆区是线程共享的,各个线程均可访问堆区中的数据,所以在多线程环境下访问堆区数据需要进行线程同步。
1.5 方法区
方法区同堆区一样,也是线程共享的。主要用于存放被虚拟机加载的类信息、常量、静态变量以及及时编译器编译的代码等数据。
- 实例对象内存模型
看完了虚拟机的整体内存布局,接下来看下实例对象的内存模型。实例对象均存储在堆上,尽管每个实例对象的所占用空间大小不一,但其内存布局上遵守同样的标准,具体分为以下几部分:
- 对象头
- 实例数据
- 对齐填充
2.1 对象头
对象头主要分为两部分:
- 运行时数据
- 类型指针
运行时数据主要包括:HashCode、GC分代年龄、锁状态标志、线程持有的锁等等;类型指针是对象执行其类元数据的指针,虚拟机通过类型指针确定该对象具体是哪个类的对象。
2.2 实例数据
实例数据即为对象实例真正存储的真实有效的数据,即类定义中相关字段的内容,这其中既包括从父类继承的也包括子类定义的。
2.3 对齐填充
对齐填充不是必然存在的,其作用仅仅是为让实例数据部分对齐。如虚拟机要求事项起始地址必须是8字节的整倍数,由于对象头所占空间本身就是8字节整倍数,如果实例数据部分不是8字节整倍数就通过对齐填充来补全。
2.4 对象访问定位
Java中通过栈上的reference类型数据在访问和操作对象,具体reference数据如何访问对象有两种方式:
- 通过句柄访问对象:Java堆中会专门空出一块空间作为句柄池,reference保存的即是对应对象的句柄地址。句柄的具体内容包括对象实例数据和对象类型数据
- 通过指针访问对象:reference保存的是对象实例数据的地址,而对象类型数据包含在对象实例数据中
两中访问方式如下图所示:
两种访问方式各有优劣,具体来说:
- 句柄访问:灵活性更强,如果对象数据地址改变只需修改句柄即可,无需修改reference
- 指针访问:效率更高,访问对象实例数据只需要一次访问即可
- 对象创建
对象创建主要涉及四个步骤:
- 类加载
- 内存分配
- 对象头设置
- 初始化
3.1 类加载
如果对象所属类并未被加载时,虚拟机需要首先执行对应类的加载过程,其中包括类的加载、校验、准备、解析、初始化等过程,具体细节将在后续博文中详细展开。
3.2 内存分配
相应类加载完成后,实例对象的所占空间大小亦完全确定了,所以可以在堆上对齐进行空间分配。
3.3 对象头设置
接下来需要设置实例对象的对象头信息,包括类元数据、HashCode、GC分代等。
3.4 对象初始化
执行对象方法,完成类对象的初始化操作。