创造与布局:剖析 Java 对象创建过程以及内存布局

简介: 创造与布局:剖析 Java 对象创建过程以及内存布局

前言

上下文提及到了类的加载过程,详细介绍了加载类的每个阶段:Loading、Linking、Initialize,在其中也说明了静态变量赋值顺序 > 先赋予默认值、在 Initialize 初始化阶段赋予初始值

从类加载到双亲委派:深入解析类加载机制与 ClassLoader

该篇文章会详细实例对象的创建过程、对象如何布局、对象头包括哪些内容以及对象如何定位、分配等

创建对象过程

创建对象的过程如下:

  1. 创建一个对象:new Obj(),第一步把 class 文件 loading 进内存中
  2. 第二步:Linking 链接阶段,分为三部分进行:Verification 校验文件是否符合 class 格式(CAFE BABY)、Preparation 将类的静态变量赋默认值、Resolution 将符号引用解析为直接引用
  3. 第三步:Initialize 初始化阶段将类的静态变量设置初始值,同时执行静态代码块语句
  4. 申请对象内存,成员变量赋默认值
  5. 调用构造方法:成员变量按顺序赋初始值、执行构造方法的代码块

创建对象需要预先申请好内存,成员变量再赋默认值,然后再调用构造方法时,先会将成员变量按顺序进行赋予初始值,再后来才调用构造方法 > 第一句先通过 super() 方法调用父类

对象布局

观察虚拟机默认配置:java -XX:+PrintCommandLineFlags -version

-XX:InitialHeapSize=23891840 -XX:MaxHeapSize=382269440 -XX:+PrintCommandLineFlags -XX:+UseCompressedClassPointers -XX:+UseCompressedOops

作为内存布局的对象分为两种:

1、普通对象

2、数组对象

普通对象

普通对象内部有几个重要的概念组成部分,如下:

  1. 对象头:包含了 Mark Word 标记字及 Klass Pointer 类型指针,长度为 8 字节

Mark Word 标记字,长度为 8 字节

ClassPointer 指针,开启:-XX:+UseCompressedClassPointers 参数后会压缩为 4 字节,不开启为 8 字节

  1. 实例数据,开启:-XX:+UseCompressedOops 参数后,开启时引用类型为 4 字节,不开启时为 8 字节
  2. 填充对齐,Padding 填充必须是 8 的整数倍

数组对象

数组对象内部有几个重要的概念组成部分,如下:

  1. 对象头:包含了 Mark Word 标记字及 Klass Pointer 类型指针,同普通对象一样
  2. 数组长度占用为 4 字节
  3. 数组数据
  4. 填充对齐,Padding 填充必须是 8 的整数倍

数组对象对比普通对象多了数组长度

如何观察 Object 大小

1、创建一个 Agent 代理类,获取对象大小

import java.lang.instrument.Instrumentation;
/**
 * @author vnjohn
 * @since 2023/06/26
 */
public class ObjectSizeAgent {
    /**
     * Java 内部字节码处理调试叫为 Instrumentation(调弦),所以我们在代理装到我们 JVM 时候可以截获这个 Instrumentation
     */
    private static Instrumentation inst;
    /**
     * 必须要有 premain 函数参数也是固定的,第二个就是 Instrumentation
     * 这个是虚拟机调用的它会帮我们初始化 instrumentation,所以调用 getObjectSize 方法才不会空指针
     */
    public static void premain(String agentArgs,Instrumentation _inst){
        inst = _inst;
    }
    public static long sizeOf(Object o){
        return inst.getObjectSize(o);
    }
}

2、在 META-INF 目录下,创建 MANIFEST.MF 文件,设置版本、主函数调用前要执行的方法,如下:

Manifest-Version: 1.0
Created-By: vnjohn
Premain-Class: com.vnjohn.jvm.agent.ObjectSizeAgent

3、在 maven build 节点下引入自定义的 MANIFEST 配置,如下:

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-jar-plugin</artifactId>
            <configuration>
                <archive>
                    <manifestFile>src/META-INF/MANIFEST.MF</manifestFile>
                </archive>
            </configuration>
        </plugin>
    </plugins>
</build>

4、将其打包成 jar 包,再其他存在主函数的项目中引入该依赖,如下:

<dependency>
    <groupId>org.vnjohn</groupId>
    <artifactId>object-size-agent</artifactId>
    <version>1.0.0-SNAPSHOT</version>
</dependency>

5、编写测试类代码(可自行调整你想知道某个类的大小)先调整启动参数,如下:

-javaagent:/Users/vnjohn/repository/org/vnjohn/object-size-agent/1.0.0-SNAPSHOT/object-size-agent-1.0.0-SNAPSHOT.jar
/**
 * @author vnjohn
 * @since 2023/6/26
 */
public class SizeOfAnObject {
  public static void main(String[] args) {
    System.out.println(ObjectSizeAgent.sizeOf(new Object()));
    System.out.println(ObjectSizeAgent.sizeOf(new int[]{}));
    System.out.println(ObjectSizeAgent.sizeOf(new OrdinaryObject()));
  }
  // 一个 Object 占多少个字节
  // Oops = ordinary object pointers  普通对象指针
  private static class OrdinaryObject {
    // 8 _markword
    // 4 _class pointer
    int id;         // 4
    String name;    // 4
    int age;        // 4
    byte b1;        // 1
    byte b2;        // 1
    Object o;       // 4
    byte b3;        // 1
  }
}

具体更多的源码及介绍,可以阅览 GitHub 仓库:object-size-agent.git

当我们要评估临时扩容方案时,都需要计算好对应实体所具体要占用的大小,以此来作为测试基准,做规划来定下最终要扩容的服务器大小及数量!!!

对象头组成部分

对象头组成部分,可以看 HotSpot 内核源码中 Mark Word 结构,在 markOop.hpp 文件中,截取一部分源码的注释部分,如下:

//  32 bits:
//  --------
//             hash:25 ------------>| age:4    biased_lock:1 lock:2 (normal object)
//             JavaThread*:23 epoch:2 age:4    biased_lock:1 lock:2 (biased object)
//             size:32 ------------------------------------------>| (CMS free block)
//             PromotedObject*:29 ---------->| promo_bits:3 ----->| (CMS promoted object)
//
//  64 bits:
//  --------
//  unused:25 hash:31 -->| unused:1   age:4    biased_lock:1 lock:2 (normal object)
//  JavaThread*:54 epoch:2 unused:1   age:4    biased_lock:1 lock:2 (biased object)
//  PromotedObject*:61 --------------------->| promo_bits:3 ----->| (CMS promoted object)
//  size:64 ----------------------------------------------------->| (CMS free block)
//
//  unused:25 hash:31 -->| cms_free:1 age:4    biased_lock:1 lock:2 (COOPs && normal object)
//  JavaThread*:54 epoch:2 cms_free:1 age:4    biased_lock:1 lock:2 (COOPs && biased object)
//  narrowOop:32 unused:24 cms_free:1 unused:4 promo_bits:3 ----->| (COOPs && CMS promoted object)
//  unused:21 size:35 -->| cms_free:1 unused:7 ------------------>| (COOPs && CMS free block)

以 64 bits 位为例,如下表:

为什么 GC 年龄默认设置为 15?

当我们使用 PS 垃圾回收器时,它默认的从年轻代升到老年代的年龄为 15,因为只有 4 bit 来表示分代年龄,最大二进制为:1111=8+4+2+1=15,所以说最大年龄也就只有 15

对象如何定位

当 new 出来一个对象,比如:new OrdinaryObject(),那么这个对象是如何被定位到的呢?

创建对象自然是为了后续使用该对象,在我们 Java 程序会通过栈上的 reference 数据来操作堆上的具体对象;由于 reference 类型在《Java 虚拟机规范》里面只是规定了它是一个指向对象的引用,并没有定义这个引用应该通过什么方式去定位;对象具体使用什么定位方式是由虚拟机实现而决定的,主流的对象定位方式主要有两种:句柄、直接指针

句柄:若使用句柄访问的话,Java 堆中将会划分一块内存来作为句柄池,reference 存储的就是对象的句柄地址,而句柄中包含了对象实例数据、类型数据各自的地址信息

直接指针:若使用直接指针访问的话,Java 堆中对象的内存布局就必须考虑如何放置类型数据的相关信息,reference 中直接存储的就是对象地址,若只是访问对象本身而不是对象类型数据的话,那么就不需要多一次的间接访问开销

这两种对象定位方式各有优劣,如下:

  1. 使用句柄来访问的最大好处就是 reference 中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而 reference 本身不需要被修改

GC 回收时效率会比较高

  1. 使用直接指针来访问的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象访问在 Java 中非常频繁,因此这类开销积少成多也是一项极为可观的执行成本,主要的虚拟机 HotSpot 就采用了这种方式进行对象访问

对象如何分配

图解过程,如下:

  1. 当 new 一个对象时,先往栈上分配,若栈上能分配就分配在栈上,当栈上弹出后对象就没了

作用于方法作用域下的对象,非本地缓存

  1. 若栈上无法分配,判断对象是否足够大,对象特别大时直接分配到堆中的老年代中
  2. 若对象不足够大,优先进行线程本地分配(TLAB:Thread Local Allocation Buffer)线程本地缓冲区能分配下就进行分配
  3. 线程本地缓冲区分配不下就分配到伊甸区,然后进行 GC 回收过程
  4. GC 分代年龄到了(最大为 15)直接进入到老年代,若年龄不到将一直在年轻代中 YGC 来 YGC 去,直接对象被回收或者年龄足够满足到达老年代

以上的过程就是所谓的对象分配

总结

该篇博文讲解了创建对象过程的几个核心步骤,剖析了对象内部是如何布局 > 普通对象、数组对象,通过了一个简单的案例来如何统计一个 Object 所占的字节大小,对象头组成部分:Mark Word、Class Pointer,介绍了对象定位的两种方式:句柄池、直接指针,最后,简要说明了对象如何分配的过程;希望你能喜欢,帮助到你是莫过于最开心的事了!

博文放在 Java 专栏里,欢迎订阅,会持续更新!

如果觉得博文不错,关注我 vnjohn,后续会有更多实战、源码、架构干货分享!

推荐专栏:Spring、MySQL,订阅一波不再迷路

大家的「关注❤️ + 点赞👍 + 收藏⭐」就是我创作的最大动力!谢谢大家的支持,我们下文见!


目录
相关文章
|
2月前
|
存储 缓存 安全
Java内存模型深度解析:从理论到实践####
【10月更文挑战第21天】 本文深入探讨了Java内存模型(JMM)的核心概念与底层机制,通过剖析其设计原理、内存可见性问题及其解决方案,结合具体代码示例,帮助读者构建对JMM的全面理解。不同于传统的摘要概述,我们将直接以故事化手法引入,让读者在轻松的情境中领略JMM的精髓。 ####
42 6
|
29天前
|
安全 Java 程序员
深入理解Java内存模型与并发编程####
本文旨在探讨Java内存模型(JMM)的复杂性及其对并发编程的影响,不同于传统的摘要形式,本文将以一个实际案例为引子,逐步揭示JMM的核心概念,包括原子性、可见性、有序性,以及这些特性在多线程环境下的具体表现。通过对比分析不同并发工具类的应用,如synchronized、volatile关键字、Lock接口及其实现等,本文将展示如何在实践中有效利用JMM来设计高效且安全的并发程序。最后,还将简要介绍Java 8及更高版本中引入的新特性,如StampedLock,以及它们如何进一步优化多线程编程模型。 ####
31 0
|
2月前
|
存储 Java 编译器
Java内存模型(JMM)深度解析####
本文深入探讨了Java内存模型(JMM)的工作原理,旨在帮助开发者理解多线程环境下并发编程的挑战与解决方案。通过剖析JVM如何管理线程间的数据可见性、原子性和有序性问题,本文将揭示synchronized关键字背后的机制,并介绍volatile关键字和final关键字在保证变量同步与不可变性方面的作用。同时,文章还将讨论现代Java并发工具类如java.util.concurrent包中的核心组件,以及它们如何简化高效并发程序的设计。无论你是初学者还是有经验的开发者,本文都将为你提供宝贵的见解,助你在Java并发编程领域更进一步。 ####
|
2月前
|
存储 算法 Java
Java内存管理深度剖析与优化策略####
本文深入探讨了Java虚拟机(JVM)的内存管理机制,重点分析了堆内存的分配策略、垃圾回收算法以及如何通过调优提升应用性能。通过案例驱动的方式,揭示了常见内存泄漏的根源与解决策略,旨在为开发者提供实用的内存管理技巧,确保应用程序既高效又稳定地运行。 ####
|
1月前
|
存储 编译器 程序员
【C语言】内存布局大揭秘 ! -《堆、栈和你从未听说过的内存角落》
在C语言中,内存布局是程序运行时非常重要的概念。内存布局直接影响程序的性能、稳定性和安全性。理解C程序的内存布局,有助于编写更高效和可靠的代码。本文将详细介绍C程序的内存布局,包括代码段、数据段、堆、栈等部分,并提供相关的示例和应用。
45 5
【C语言】内存布局大揭秘 ! -《堆、栈和你从未听说过的内存角落》
|
1月前
|
存储 监控 算法
Java内存管理深度剖析:从垃圾收集到内存泄漏的全面指南####
本文深入探讨了Java虚拟机(JVM)中的内存管理机制,特别是垃圾收集(GC)的工作原理及其调优策略。不同于传统的摘要概述,本文将通过实际案例分析,揭示内存泄漏的根源与预防措施,为开发者提供实战中的优化建议,旨在帮助读者构建高效、稳定的Java应用。 ####
39 8
|
26天前
|
机器学习/深度学习 人工智能 缓存
【AI系统】推理内存布局
本文介绍了CPU和GPU的基础内存知识,NCHWX内存排布格式,以及MNN推理引擎如何通过数据内存重新排布进行内核优化,特别是针对WinoGrad卷积计算的优化方法,通过NC4HW4数据格式重排,有效利用了SIMD指令集特性,减少了cache miss,提高了计算效率。
45 3
|
29天前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
30天前
|
缓存 监控 算法
Python内存管理:掌握对象的生命周期与垃圾回收机制####
本文深入探讨了Python中的内存管理机制,特别是对象的生命周期和垃圾回收过程。通过理解引用计数、标记-清除及分代收集等核心概念,帮助开发者优化程序性能,避免内存泄漏。 ####
41 3
|
1月前
|
存储 算法 Java
Java 内存管理与优化:掌控堆与栈,雕琢高效代码
Java内存管理与优化是提升程序性能的关键。掌握堆与栈的运作机制,学习如何有效管理内存资源,雕琢出更加高效的代码,是每个Java开发者必备的技能。
55 5