从JVM角度看对象创建的过程

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 对象创建过程如下: 通过new指令参数查找常量池中类的符号引用,检查此 符号引用代表的类是否已经被加载、准备、解析、初始化过,如果没有则先执行这些操作。 计算并为对象分配内存。 将分配的内存空间初始化为零值。 设置对象头 执行构造函数。


本博客主要讲述对象创建的详细过程,即当虚拟机遇到一条new指令时是如何处理的呢?

提前说明:如果想比较好的理解对象创建的全过程,需要提前对类的加载过程需要有一个清晰的认识,可以参考我之前的一篇博客《类的加载过程》,地址:https://yq.aliyun.com/articles/377198

 

接下来我们根据一个示例讲述对象的创建过程。示例代码中我们创建一个对象仅仅需要写一句简单的代码Test test = new Test(),但jvm做的事情可能远远超过我们的想想。

1 示例

1)   源码

public class Test {
 
    public static void main(String[] args) {
        Test test = new Test();
    }
 
}


 

2)  编译后

Constant pool:
   #1 = Methodref          #4.#13         // java/lang/Object."<init>":()V
   #2 = Class              #14            // com/wzf/greattruth/jvm/Test
   #3 = Methodref          #2.#13         // com/wzf/greattruth/jvm/Test."<init>":()V
   #4 = Class              #15            // java/lang/Object
   #5 = Utf8               <init>
   #6 = Utf8               ()V
   #7 = Utf8               Code
   #8 = Utf8               LineNumberTable
   #9 = Utf8               main
  #10 = Utf8               ([Ljava/lang/String;)V
  #11 = Utf8               SourceFile
  #12 = Utf8               Test.java
  #13 = NameAndType        #5:#6          // "<init>":()V
  #14 = Utf8               com/wzf/greattruth/jvm/Test
  #15 = Utf8               java/lang/Object
{
  public com.wzf.greattruth.jvm.Test();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 3: 0
 
  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=2, args_size=1
         0: new           #2                  // 创建一个对象,并将其引用值压入栈顶
         3: dup                               // 复制栈顶值并将复制值压入栈顶
         4: invokespecial #3                  // 调用"<init>":()V方法,即调用实例构造器
         7: astore_1                          // 将站定引用类型的数值存入指定本地变量变第1个slot中
         8: return                            //
      LineNumberTable:
        line 6: 0
        line 7: 8
}


 

2 查找类的符号引用

虚拟机遇到一条new指令时,首先去检查这个指令的参数是否能在常量池中定位到一个类的符号引用。

从上面示例代码中可以看到,通过以下过程定位类的符号引用。

         0: new           #2                  // 创建一个对象,并将其引用值压入栈顶

通过new的参数,从常量池查找,最终将找到一个类的符号引用。如下下所示:

Constant pool:

   #1 = Methodref          #4.#13         // java/lang/Object."<init>":()V

   #2 = Class              #14            // com/wzf/greattruth/jvm/Test

   #14 = Utf8               com/wzf/greattruth/jvm/Test


3 加载、准备、解析、初始化

找到类的符号引用以后,检查这个符号引用代表的类是否已经被加载、准备、解析、初始化。如果没有,则执行加载、准备、解析、初始化等操作。

1)  加载阶段

主要完成三件事情:

    • 通过类的权限定名来获取此类的二进制字节流。
    • 将这个类的二进制字节流转换成方法区的运行时数据结构。
    • 在内存中生成代表这个类的java.lang.Class对象,作为方法区这个类的访问入口。

2)  准备阶段

为类变量分配内存并设置类变量初始值的阶段。类变量指的是使用static修饰的变量。

 

3)  解析阶段

是将常量池内的符号引用替换成直接引用的过程。

 

4)  其他说明

其实,类加载过程包括加载、验证、准备、解析、初始化等阶段,因为验证与这里讲述的内容关系不大,所以就没有提及,详情可参考博客《虚拟机类加载过程》,类的生命周期如下图所示:

881b7eaa169eb8dbb3aa93a8b022bc0389fe3af1

 

4 分配内存

接下来就是为对象分配内存。对象所需要的内存大小在类加载完成后便可以确定,为对象分配内存的任务等同于从堆中划分出一块确定大小的内存出来。接下来我们就从细节上讨论其是如何实现的。

1)  如何确定对象需要多大的内存?

对象的内存布局包括:对象头、实例数据、对其填充三部分。

a)   对象头

对象头以分为Mark Word、类型指针、数组长度(如果是数组的话)。

Mark Word

用来存储对象自身的运行时基本数据信息,如hashCode、GC分代年龄、锁状态标志(轻量级锁、重量级锁)、线程持有的锁(轻量级锁、重量级锁)等。这部分数据的长度在32bit和64bit虚拟机上分别为32bit和64bit

类型指针

指向类的元数据信息的引用JVM通过这个指针来确定这个对象是哪个类的实例。

数组长度

如果对象是一个Java数组,对象头中还要有一块记录数组长度的数据。

空间总计

在64位的服务器上,对象头占用16 byte的空间(8 byte的mark word + 8 byte的类型指针);如果是数组的话,对象头占用20 byte的空间(16 byte + 4 byte的数组长度,因为数组长度类型为int)。

b)    实例数据

存储的是真正有效数据,如各种字段内容,各字段的分配策略为longs/doubles、ints、shorts/chars、bytes/boolean、oops(ordinary object pointers),相同宽度的字段总是被分配到一起,便于之后取数据,父类定义的变量会出现在子类前面。

各种类型数据的大小为:

类型

占用空间(byte)

boolean

1

byte

1

short

2

char

2

int

4

float

4

long

8

double

8

reference

32位操作系统:4

64位操作系统:8

c)    对齐填充

HotSpot的对齐方式为8字节对齐,所以要保证对象头、实例数据、对齐填充应该是8的倍数,即:

(对象头 + 实例数据 + padding)% 8 = 0

0 <= padding < 8

 

d)   计算示例

以下内存占用均在64位的服务器上计算,并且关闭UseCompressedOops。这里讲述三个简单的示例,更多示例请参考博客内容。我写了一个工具类,可以方便的计算对象大小,如果有兴趣可以可以测试一下,git地址:git@gitee.com:wuzhengfei/sword-size.git,请按照README.md文件的说明操作。

示例一

public class A {
    // int占4 byte
    private int a;
}

对象头占16 byte + a占4 byte = 20 byte;20不是8的倍数,需要加4 byte的对齐填充,总计占用内存24 byte

 

示例二

public class B {
    //int占4 byte
    private int a;
    //reference占8 byte
    private Long b;
}

对象头占16 byte + a占4 byte + b占8 byte = 28 byte;28不是8的倍数,需要加4 byte的对齐填充,总计占用内存32 byte

 

示例三

new Integer[1]

对象头占20 byte + 8 byte的reference类型数据存储空间 = 28 byte,不是8的倍数,需要加4 byte的对其填充,总计占用内存32 byte。

new Integer[4]

对象头占20 byte + 4 * 8 byte的reference类型数据存储空间 = 52 byte,不是8的倍数,需要加4 byte的对其填充,总计占用内存56 byte。

 

2)  如何从堆中划分出一块确定大小的内存?

根据上面部分的内容我们可以计算出对象需要的内存大小,接下来就是从堆中划出一块内存区域给这个对象使用。如何划分,由java堆中的内存是否规整决定。

假设java堆中内存规整,所有用过的内存放在一块,没有使用过的内存放一块,中间放着一个指针作为分界点指示器,那么分配内存就是把指针向空闲空间那边挪动一段(大小等于对象内存),这种分配方式称为指针碰撞(Bump the pointer)。使用标记整理算法管理的内存块就属于此类。

假设java堆中内存不规整,已使用的内存和空闲内存相互交错,此时虚拟机就必须维护一个列表,记录上那些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表的记录(标识此快空间已被使用),这种分配方式称为空闲列表(Free List)。使用标记清除算法管理的内存块就属于此类。

为对象分配内存是非常频繁的动作,有并发开发经验的小伙伴可能会有疑问,并发情况下的线程安全如何保障?即假设正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存,此种情况下JVM如何保证不会出现这种问题的?解决此问题的方案有两个:

一是:对分配内存空间的动作进行同步处理,实际上虚拟机采用CAS加失败重试的方式保证更新操作的原子性。

二是:把内存分配的动作按照线程划分在不同的空间中进行,即每个线程在java堆中预先分配一块内存,作为本地线程分配缓冲区(Thread Local Allocation Buffer, TLAB)。某一个线程需要分配内存时,在此线程的TLAB中分配即可,只有TLAB用完并分配新的TLAB时,才需要同步锁定。虚拟机通过-XX:+/-UseTLAB来决定是否使用TLAB。

需要注意的是:jvm对象的内存分配与回收是有一定策略的,分配是按照这些策略进行。策略如下:

  • 对象优先分配到新生代的Eden区
  • 大对象直接进入老年代。
  • 长期存活的对象将进入老年代
  • 动态对象年龄判断,超过阈值从新生代晋升到年老代。
  • 空间分配担保。

因为讨论这些内容超出本文的范围,所以不过多讲述,如有兴趣可以参考垃圾回收与内存分配的博客。

 

5 将分配到的内存空间初始化为零值

内存分配完毕以后,虚拟机需要将分配的内存空间都初始化为零值(不包括对象头),如果使用TLAB,初始化为零值的过程提前至分配TLAB时进行。这一步操作保证对象的实例字段在java代码中可以不赋初始值就可以直接使用,此时实例字段根据类型分别取不同的值,具体如下:

数据类型

零值

int

0

long

0L

short

(short)0

char

'\u0000'

byte

(byte)0

boolean

false

float

0.0f

double

0.0d

reference

null

 

6 对象头设置

接下来虚拟机需要设置对象的对象头。例如:对象的类型,如何找到累的元数据信息,对象的哈希码,gc年龄代信息,偏向锁、轻量级锁等。

 

7 执行构造函数

经过上面的几步,从虚拟机的角度来看,一个新的对象已经产生了,但从java程序的角度来看,对象的创建才刚刚开始,因为对象的构造函数还未执行,对象的所有实例字段都是零值。

接下来通过【invokespecial #3】指令将执行构造函数,按照我们的代码来执行初始化。此过程结束,对象方才算创建结束。字节码示例如下:

         0: new           #2                  // 创建一个对象,并将其引用值压入栈顶

           3: dup                               // 复制栈顶值并将复制值压入栈顶

         4: invokespecial #3                  // 调用"<init>":()V方法,即调用实例构造器

 

8 总结

让我们总结一下对象的创建过程:

通过new指令参数查找常量池中类的符号引用,检查此

符号引用代表的类是否已经被加载、准备、解析、初始化过,如果没有则先执行这些操作。

计算并为对象分配内存。

将分配的内存空间初始化为零值。

设置对象头

执行构造函数。

 

9 参考博客

类的加载过程

https://yq.aliyun.com/articles/377198

 

一个Java对象到底占用多大内存

http://blog.csdn.net/rainnnbow/article/details/48655671

 

JAVA Instrumentation

http://blog.csdn.net/productshop/article/details/50623626

 

 

相关文章
|
6月前
|
存储 安全 算法
深入剖析JVM内存管理与对象创建原理
JVM内存管理,JVM运行时区域,直接内存,对象创建原理。
104 2
|
6月前
|
存储 算法 安全
【JVM】深入理解JVM对象内存分配方式
【JVM】深入理解JVM对象内存分配方式
86 0
|
3天前
|
存储 算法 Java
散列表的数据结构以及对象在JVM堆中的存储过程
本文介绍了散列表的基本概念及其在JVM中的应用,详细讲解了散列表的结构、对象存储过程、Hashtable的扩容机制及与HashMap的区别。通过实例和图解,帮助读者理解散列表的工作原理和优化策略。
15 1
散列表的数据结构以及对象在JVM堆中的存储过程
|
25天前
|
缓存 算法 Java
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
这篇文章详细介绍了Java虚拟机(JVM)中的垃圾回收机制,包括垃圾的定义、垃圾回收算法、堆内存的逻辑分区、对象的内存分配和回收过程,以及不同垃圾回收器的工作原理和参数设置。
50 4
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
|
26天前
|
存储 Java
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
这篇文章详细地介绍了Java对象的创建过程、内存布局、对象头的MarkWord、对象的定位方式以及对象的分配策略,并深入探讨了happens-before原则以确保多线程环境下的正确同步。
47 0
JVM知识体系学习四:排序规范(happens-before原则)、对象创建过程、对象的内存中存储布局、对象的大小、对象头内容、对象如何定位、对象如何分配
|
27天前
|
算法 Java
JVM进阶调优系列(3)堆内存的对象什么时候被回收?
堆对象的生命周期是咋样的?什么时候被回收,回收前又如何流转?具体又是被如何回收?今天重点讲对象GC,看完这篇就全都明白了。
|
3月前
|
存储 Java 程序员
Java中对象几种类型的内存分配(JVM对象储存机制)
Java中对象几种类型的内存分配(JVM对象储存机制)
79 5
Java中对象几种类型的内存分配(JVM对象储存机制)
|
4月前
|
存储 监控 算法
(六)JVM成神路之GC基础篇:对象存活判定算法、GC算法、STW、GC种类详解
经过前面五个章节的分析后,对于JVM的大部分子系统都已阐述完毕,在本文中则开始对JVM的GC子系统进行全面阐述,GC机制也是JVM的重中之重,调优、监控、面试都逃不开的JVM话题。
119 8
|
4月前
|
存储 缓存 算法
(五)JVM成神路之对象内存布局、分配过程、从生至死历程、强弱软虚引用全面剖析
在上篇文章中曾详细谈到了JVM的内存区域,其中也曾提及了:Java程序运行过程中,绝大部分创建的对象都会被分配在堆空间内。而本篇文章则会站在对象实例的角度,阐述一个Java对象从生到死的历程、Java对象在内存中的布局以及对象引用类型。
121 8
|
5月前
|
算法 Java
Java垃圾回收(Garbage Collection,GC)是Java虚拟机(JVM)的一种自动内存管理机制,用于在运行时自动回收不再使用的对象所占的内存空间
【6月更文挑战第18天】Java的GC自动回收内存,包括标记清除(产生碎片)、复制(效率低)、标记整理(兼顾连续性与效率)和分代收集(区分新生代和老年代,用不同算法优化)等策略。现代JVM通常采用分代收集,以平衡性能和内存利用率。
70 3