创造与布局:剖析 Java 对象创建过程以及内存布局

简介: 创造与布局:剖析 Java 对象创建过程以及内存布局

前言

上下文提及到了类的加载过程,详细介绍了加载类的每个阶段:Loading、Linking、Initialize,在其中也说明了静态变量赋值顺序 > 先赋予默认值、在 Initialize 初始化阶段赋予初始值

从类加载到双亲委派:深入解析类加载机制与 ClassLoader

该篇文章会详细实例对象的创建过程、对象如何布局、对象头包括哪些内容以及对象如何定位、分配等

创建对象过程

创建对象的过程如下:

  1. 创建一个对象:new Obj(),第一步把 class 文件 loading 进内存中
  2. 第二步:Linking 链接阶段,分为三部分进行:Verification 校验文件是否符合 class 格式(CAFE BABY)、Preparation 将类的静态变量赋默认值、Resolution 将符号引用解析为直接引用
  3. 第三步:Initialize 初始化阶段将类的静态变量设置初始值,同时执行静态代码块语句
  4. 申请对象内存,成员变量赋默认值
  5. 调用构造方法:成员变量按顺序赋初始值、执行构造方法的代码块

创建对象需要预先申请好内存,成员变量再赋默认值,然后再调用构造方法时,先会将成员变量按顺序进行赋予初始值,再后来才调用构造方法 > 第一句先通过 super() 方法调用父类

对象布局

观察虚拟机默认配置:java -XX:+PrintCommandLineFlags -version

-XX:InitialHeapSize=23891840 -XX:MaxHeapSize=382269440 -XX:+PrintCommandLineFlags -XX:+UseCompressedClassPointers -XX:+UseCompressedOops

作为内存布局的对象分为两种:

1、普通对象

2、数组对象

普通对象

普通对象内部有几个重要的概念组成部分,如下:

  1. 对象头:包含了 Mark Word 标记字及 Klass Pointer 类型指针,长度为 8 字节

Mark Word 标记字,长度为 8 字节

ClassPointer 指针,开启:-XX:+UseCompressedClassPointers 参数后会压缩为 4 字节,不开启为 8 字节

  1. 实例数据,开启:-XX:+UseCompressedOops 参数后,开启时引用类型为 4 字节,不开启时为 8 字节
  2. 填充对齐,Padding 填充必须是 8 的整数倍

数组对象

数组对象内部有几个重要的概念组成部分,如下:

  1. 对象头:包含了 Mark Word 标记字及 Klass Pointer 类型指针,同普通对象一样
  2. 数组长度占用为 4 字节
  3. 数组数据
  4. 填充对齐,Padding 填充必须是 8 的整数倍

数组对象对比普通对象多了数组长度

如何观察 Object 大小

1、创建一个 Agent 代理类,获取对象大小

import java.lang.instrument.Instrumentation;
/**
 * @author vnjohn
 * @since 2023/06/26
 */
public class ObjectSizeAgent {
    /**
     * Java 内部字节码处理调试叫为 Instrumentation(调弦),所以我们在代理装到我们 JVM 时候可以截获这个 Instrumentation
     */
    private static Instrumentation inst;
    /**
     * 必须要有 premain 函数参数也是固定的,第二个就是 Instrumentation
     * 这个是虚拟机调用的它会帮我们初始化 instrumentation,所以调用 getObjectSize 方法才不会空指针
     */
    public static void premain(String agentArgs,Instrumentation _inst){
        inst = _inst;
    }
    public static long sizeOf(Object o){
        return inst.getObjectSize(o);
    }
}

2、在 META-INF 目录下,创建 MANIFEST.MF 文件,设置版本、主函数调用前要执行的方法,如下:

Manifest-Version: 1.0
Created-By: vnjohn
Premain-Class: com.vnjohn.jvm.agent.ObjectSizeAgent

3、在 maven build 节点下引入自定义的 MANIFEST 配置,如下:

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-jar-plugin</artifactId>
            <configuration>
                <archive>
                    <manifestFile>src/META-INF/MANIFEST.MF</manifestFile>
                </archive>
            </configuration>
        </plugin>
    </plugins>
</build>

4、将其打包成 jar 包,再其他存在主函数的项目中引入该依赖,如下:

<dependency>
    <groupId>org.vnjohn</groupId>
    <artifactId>object-size-agent</artifactId>
    <version>1.0.0-SNAPSHOT</version>
</dependency>

5、编写测试类代码(可自行调整你想知道某个类的大小)先调整启动参数,如下:

-javaagent:/Users/vnjohn/repository/org/vnjohn/object-size-agent/1.0.0-SNAPSHOT/object-size-agent-1.0.0-SNAPSHOT.jar
/**
 * @author vnjohn
 * @since 2023/6/26
 */
public class SizeOfAnObject {
  public static void main(String[] args) {
    System.out.println(ObjectSizeAgent.sizeOf(new Object()));
    System.out.println(ObjectSizeAgent.sizeOf(new int[]{}));
    System.out.println(ObjectSizeAgent.sizeOf(new OrdinaryObject()));
  }
  // 一个 Object 占多少个字节
  // Oops = ordinary object pointers  普通对象指针
  private static class OrdinaryObject {
    // 8 _markword
    // 4 _class pointer
    int id;         // 4
    String name;    // 4
    int age;        // 4
    byte b1;        // 1
    byte b2;        // 1
    Object o;       // 4
    byte b3;        // 1
  }
}

具体更多的源码及介绍,可以阅览 GitHub 仓库:object-size-agent.git

当我们要评估临时扩容方案时,都需要计算好对应实体所具体要占用的大小,以此来作为测试基准,做规划来定下最终要扩容的服务器大小及数量!!!

对象头组成部分

对象头组成部分,可以看 HotSpot 内核源码中 Mark Word 结构,在 markOop.hpp 文件中,截取一部分源码的注释部分,如下:

//  32 bits:
//  --------
//             hash:25 ------------>| age:4    biased_lock:1 lock:2 (normal object)
//             JavaThread*:23 epoch:2 age:4    biased_lock:1 lock:2 (biased object)
//             size:32 ------------------------------------------>| (CMS free block)
//             PromotedObject*:29 ---------->| promo_bits:3 ----->| (CMS promoted object)
//
//  64 bits:
//  --------
//  unused:25 hash:31 -->| unused:1   age:4    biased_lock:1 lock:2 (normal object)
//  JavaThread*:54 epoch:2 unused:1   age:4    biased_lock:1 lock:2 (biased object)
//  PromotedObject*:61 --------------------->| promo_bits:3 ----->| (CMS promoted object)
//  size:64 ----------------------------------------------------->| (CMS free block)
//
//  unused:25 hash:31 -->| cms_free:1 age:4    biased_lock:1 lock:2 (COOPs && normal object)
//  JavaThread*:54 epoch:2 cms_free:1 age:4    biased_lock:1 lock:2 (COOPs && biased object)
//  narrowOop:32 unused:24 cms_free:1 unused:4 promo_bits:3 ----->| (COOPs && CMS promoted object)
//  unused:21 size:35 -->| cms_free:1 unused:7 ------------------>| (COOPs && CMS free block)

以 64 bits 位为例,如下表:

为什么 GC 年龄默认设置为 15?

当我们使用 PS 垃圾回收器时,它默认的从年轻代升到老年代的年龄为 15,因为只有 4 bit 来表示分代年龄,最大二进制为:1111=8+4+2+1=15,所以说最大年龄也就只有 15

对象如何定位

当 new 出来一个对象,比如:new OrdinaryObject(),那么这个对象是如何被定位到的呢?

创建对象自然是为了后续使用该对象,在我们 Java 程序会通过栈上的 reference 数据来操作堆上的具体对象;由于 reference 类型在《Java 虚拟机规范》里面只是规定了它是一个指向对象的引用,并没有定义这个引用应该通过什么方式去定位;对象具体使用什么定位方式是由虚拟机实现而决定的,主流的对象定位方式主要有两种:句柄、直接指针

句柄:若使用句柄访问的话,Java 堆中将会划分一块内存来作为句柄池,reference 存储的就是对象的句柄地址,而句柄中包含了对象实例数据、类型数据各自的地址信息

直接指针:若使用直接指针访问的话,Java 堆中对象的内存布局就必须考虑如何放置类型数据的相关信息,reference 中直接存储的就是对象地址,若只是访问对象本身而不是对象类型数据的话,那么就不需要多一次的间接访问开销

这两种对象定位方式各有优劣,如下:

  1. 使用句柄来访问的最大好处就是 reference 中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而 reference 本身不需要被修改

GC 回收时效率会比较高

  1. 使用直接指针来访问的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象访问在 Java 中非常频繁,因此这类开销积少成多也是一项极为可观的执行成本,主要的虚拟机 HotSpot 就采用了这种方式进行对象访问

对象如何分配

图解过程,如下:

  1. 当 new 一个对象时,先往栈上分配,若栈上能分配就分配在栈上,当栈上弹出后对象就没了

作用于方法作用域下的对象,非本地缓存

  1. 若栈上无法分配,判断对象是否足够大,对象特别大时直接分配到堆中的老年代中
  2. 若对象不足够大,优先进行线程本地分配(TLAB:Thread Local Allocation Buffer)线程本地缓冲区能分配下就进行分配
  3. 线程本地缓冲区分配不下就分配到伊甸区,然后进行 GC 回收过程
  4. GC 分代年龄到了(最大为 15)直接进入到老年代,若年龄不到将一直在年轻代中 YGC 来 YGC 去,直接对象被回收或者年龄足够满足到达老年代

以上的过程就是所谓的对象分配

总结

该篇博文讲解了创建对象过程的几个核心步骤,剖析了对象内部是如何布局 > 普通对象、数组对象,通过了一个简单的案例来如何统计一个 Object 所占的字节大小,对象头组成部分:Mark Word、Class Pointer,介绍了对象定位的两种方式:句柄池、直接指针,最后,简要说明了对象如何分配的过程;希望你能喜欢,帮助到你是莫过于最开心的事了!

博文放在 Java 专栏里,欢迎订阅,会持续更新!

如果觉得博文不错,关注我 vnjohn,后续会有更多实战、源码、架构干货分享!

推荐专栏:Spring、MySQL,订阅一波不再迷路

大家的「关注❤️ + 点赞👍 + 收藏⭐」就是我创作的最大动力!谢谢大家的支持,我们下文见!


目录
相关文章
|
25天前
|
存储 Java 编译器
Java内存模型(JMM)深度解析####
本文深入探讨了Java内存模型(JMM)的工作原理,旨在帮助开发者理解多线程环境下并发编程的挑战与解决方案。通过剖析JVM如何管理线程间的数据可见性、原子性和有序性问题,本文将揭示synchronized关键字背后的机制,并介绍volatile关键字和final关键字在保证变量同步与不可变性方面的作用。同时,文章还将讨论现代Java并发工具类如java.util.concurrent包中的核心组件,以及它们如何简化高效并发程序的设计。无论你是初学者还是有经验的开发者,本文都将为你提供宝贵的见解,助你在Java并发编程领域更进一步。 ####
|
2月前
|
缓存 easyexcel Java
Java EasyExcel 导出报内存溢出如何解决
大家好,我是V哥。使用EasyExcel进行大数据量导出时容易导致内存溢出,特别是在导出百万级别的数据时。以下是V哥整理的解决该问题的一些常见方法,包括分批写入、设置合适的JVM内存、减少数据对象的复杂性、关闭自动列宽设置、使用Stream导出以及选择合适的数据导出工具。此外,还介绍了使用Apache POI的SXSSFWorkbook实现百万级别数据量的导出案例,帮助大家更好地应对大数据导出的挑战。欢迎一起讨论!
173 1
|
29天前
|
安全 Java 编译器
Java对象一定分配在堆上吗?
本文探讨了Java对象的内存分配问题,重点介绍了JVM的逃逸分析技术及其优化策略。逃逸分析能判断对象是否会在作用域外被访问,从而决定对象是否需要分配到堆上。文章详细讲解了栈上分配、标量替换和同步消除三种优化策略,并通过示例代码说明了这些技术的应用场景。
Java对象一定分配在堆上吗?
|
6天前
|
Java
java内存区域
1)栈内存:保存所有的对象名称 2)堆内存:保存每个对象的具体属性 3)全局数据区:保存static类型的属性 4)全局代码区:保存所有的方法定义
17 1
|
20天前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
40 6
|
19天前
|
存储 编译器 Linux
【c++】类和对象(上)(类的定义格式、访问限定符、类域、类的实例化、对象的内存大小、this指针)
本文介绍了C++中的类和对象,包括类的概念、定义格式、访问限定符、类域、对象的创建及内存大小、以及this指针。通过示例代码详细解释了类的定义、成员函数和成员变量的作用,以及如何使用访问限定符控制成员的访问权限。此外,还讨论了对象的内存分配规则和this指针的使用场景,帮助读者深入理解面向对象编程的核心概念。
45 4
|
2月前
|
Java API
Java 对象释放与 finalize 方法
关于 Java 对象释放的疑惑解答,以及 finalize 方法的相关知识。
48 17
|
24天前
|
存储 缓存 安全
Java内存模型(JMM):深入理解并发编程的基石####
【10月更文挑战第29天】 本文作为一篇技术性文章,旨在深入探讨Java内存模型(JMM)的核心概念、工作原理及其在并发编程中的应用。我们将从JMM的基本定义出发,逐步剖析其如何通过happens-before原则、volatile关键字、synchronized关键字等机制,解决多线程环境下的数据可见性、原子性和有序性问题。不同于常规摘要的简述方式,本摘要将直接概述文章的核心内容,为读者提供一个清晰的学习路径。 ####
37 2
|
25天前
|
存储 安全 Java
什么是 Java 的内存模型?
Java内存模型(Java Memory Model, JMM)是Java虚拟机(JVM)规范的一部分,它定义了一套规则,用于指导Java程序中变量的访问和内存交互方式。
61 1
|
1月前
|
存储 安全 Java
Java编程中的对象序列化与反序列化
【10月更文挑战第22天】在Java的世界里,对象序列化和反序列化是数据持久化和网络传输的关键技术。本文将带你了解如何在Java中实现对象的序列化与反序列化,并探讨其背后的原理。通过实际代码示例,我们将一步步展示如何将复杂数据结构转换为字节流,以及如何将这些字节流还原为Java对象。文章还将讨论在使用序列化时应注意的安全性问题,以确保你的应用程序既高效又安全。