一文解读类的加载过程(类的生命周期)(上)

简介: 一文解读类的加载过程(类的生命周期)

概述总览

在Java中数据类型分为基本数据类型和引用数据类型。基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载。

按照Java虚拟机规范,从class文件到加载到内存中的类,到类卸载出内存为止,它的整个生命周期包括如下7个阶段:

其中,验证、准备、解析3个部分统称为链接(Linking)

过程一:Loading(加载)阶段

加载完成的操作

什么是加载?

所谓加载,简单来说就是将java类的字节码文件加载到机器内存中,并在内存中构建出java的原型,也是类模板对象

所谓类模板对象,其实就是Java类在]VM内存中的一个快照,JVM将从字节码文件中解析出的常量池、类字段、类方法等信息存储到类模板中,这样]VM在运行期便能通过类模板而获取Java类中的任意信息,能够对Java类的成员变量进行遍历,也能进行Java方法的调用。

反射的机制即基于这一基础。如果JVM没有将Java类的声明信息存储起来,则JVM在运行期也无法反射。

在加载类时,Java虚拟机必须完成以下3件事情:

  • 通过类的全名,获取类的二进制数据流。
  • 解析类的二进制数据流为方法区内的数据结构(Java类模型)
  • 创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口

二进制流的获取方式

对于类的二进制数据流,虚拟机可以通过多种途径产生或获得。(只要所读取的字节码符合JVM规范即可,jvm虚拟机不仅仅可以运行java,只要符合规范即可)

  • 虚拟机可能通过文件系统读入一个class后缀的文件
  • 读入jar、zip等归档数据包,提取类文件。
  • 事先存放在数据库中的类的二进制数据
  • 使用类似于HTTP之类的协议通过网络进行加载
  • 在运行时生成一段class的二进制信息等
  • 在获取到类的二进制信息后,Java虚拟机就会处理这些数据,并最终转为一个java.lang.Class的实例。

如果输入数据不是ClassFile的结构,则会抛出ClassFormatError。

类模型与Class实例的位置

类模型的位置

加载的类在JVM中创建相应的类结构,类结构会存储在方法区(JDKl.8之前:永久代;J0Kl.8及之后:元空间)。

Class实例的位置

类将.class文件加载至元空间后,会在堆中创建一个Java.lang.Class对象,用来封装类位于方法区内的数据结构,该Class对象是在加载类的过程中创建的,每个类都对应有一个Class类型的对象。

数组类的加载

创建数组类的情况稍微有些特殊,因为数组类本身并不是由类加载器负责创建,而是由JVM在运行时根据需要而直接创建的,但数组的元素类型仍然需要依靠类加载器去创建。创建数组类(下述简称A)的过程:

  • 如果数组的元素类型是引用类型,那么就遵循定义的加载过程递归加载和创建数组A的元素类型;
  • JVM使用指定的元素类型和数组维度来创建新的数组类。

如果数组的元素类型是引用类型,数组类的可访问性就由元素类型的可访问性决定。否则数组类的可访问性将被缺省定义为public。

过程二:Linking(链接)阶段

环节1:链接阶段之Verification(验证)

当类加载到系统后,就开始链接操作,验证是链接操作的第一步。为了保证字节码的合法,合法,符合jvm规定。验证的步骤比较复杂,实际要验证的项目也很繁多,大体上Java虚拟机需要做以下检查,如图所示。

验证的内容则涵盖了类数据信息的格式验证、语义检查、字节码验证,以及符号引用验证等。  链接阶段的验证虽然拖慢了加载速度,但是它避免了在字节码运行时还需要进行各种检查。

格式验证部分会跟类的加载阶段一起进行的

具体说明:

格式验证:是否以魔数0XCAFEBABE开头,主版本和副版本号是否在当前Java虚拟机的支持范围内,数据中每一个项是否都拥有正确的长度等。

语义检查:Java虚拟机会进行字节码的语义检查,但凡在语义上不符合规范的,虚拟机也不会给予验证通过。比如:

  • 是否所有的类都有父类的存在(在Java里,除了object外,其他类都应该有父类)
  • 是否一些被定义为final的方法或者类被重写或继承了
  • 非抽象类是否实现了所有抽象方法或者接口方法

字节码验证(最复杂的一个过程):Java虚拟机还会进行字节码验证。它试图通过对字节码流的分析,判断字节码是否可以被正确地执行。比如:

  • 在字节码的执行过程中,是否会跳转到一条不存在的指令
  • 函数的调用是否传递了正确类型的参数
  • 变量的赋值是不是给了正确的数据类型等

栈映射帧(StackMapTable)就是在这个阶段,用于检测在特定的字节码处,其局部变量表和操作数栈是否有着正确的数据类型。但遗憾的是,100%准确地判断一段字节码是否可以被安全执行是无法实现的,因此,该过程只是尽可能地检查出可以预知的明显的问题。如果在这个阶段无法通过检查,虚拟机也不会正确装载这个类。但是,如果通过了这个阶段的检查,也不能说明这个类是完全没有问题的。

栈映射帧的概念,就是表示在执行某一条字节码指令之前,帧的状态,即局部变量表和操作数栈的状态,不是每条字节码前面都有栈映射帧,通常在有条件跳转或无条件跳转之后或者抛出异常之前。

环节2:链接阶段之Preparation(准备)

准备阶段,简单来说,就是为类的静态分配内存,并将其初始化为默认值

当一个类验证通过时,虚拟机就会进入准备阶段。在这个阶段,虚拟机就会为这个类分配相应的内存空间,并设置默认初始值。Java虚拟机为各类型变量默认的初始值如表所示。

类型

默认初始值

byte

0

short

0

int

0

long

0L

float

0.0f

double

0.0

char

\u0000

boolean

false

reference

null

在这里需要注意的是:java并不支持boolean类型,对于boolean类型,内部实现是int,由于int的默认值是0,故对应的,boolean的默认值就是false。 而且这里并没有对static fianl修饰的变量进行赋值,因为final修饰的变量已经在编译阶段就进行了赋默认值,而在准备阶段进行的是显式赋值

1. // 一般情况:static final修饰的基本数据类型、字符串类型字面量会在准备阶段赋值
2. private static final String str = "Hello world";
3. // 特殊情况:static final修饰的引用类型不会在准备阶段赋值,而是在初始化阶段赋值
4. private static final String str = new String("Hello world");
  • 这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
  • 在这个阶段并不会像初始化阶段中那样会有初始化或者代码被执行。

环节3:链接阶段之Resolution(解析)

在准备阶段完成后,就进入了解析阶段。解析阶段(Resolution),简言之,将类、接口、字段和方法的符号引用转为直接引用。

符号引用就是一些字面量的引用,和虚拟机的内部数据结构和和内存布局无关。比较容易理解的就是在Class类文件中,通过常量池进行了大量的符号引用。但是在程序实际运行时,只有符号引用是不够的,比如当如下println()方法被调用时,系统需要明确知道该方法的位置。

System.out.println()对应的字节码:

invokevirtual #24 <java/io/PrintStream.println>

以方法为例,Java虚拟机为每个类都准备了一张方法表,将其所有的方法都列在表中,当需要调用一个类的方法的时候,只要知道这个方法在方法表中的偏移量就可以直接调用该方法。通过解析操作,符号引用就可以转变为目标方法在类中方法表中的位置,从而使得方法被成功调用

过程三:Initialization(初始化)阶段

static与final的搭配问题

说明:使用static+ final修饰的字段的显式赋值的操作,到底是在哪个阶段进行的赋值?

  • 情况1:在链接阶段的准备环节赋值
  • 情况2:在初始化阶段<clinit>()中赋值

结论: 在链接阶段的准备环节赋值的情况:

  • 对于基本数据类型的字段来说,如果使用static final修饰,则显式赋值(直接赋值常量,而非调用方法通常是在链接阶段的准备环节进行
  • 对于String来说,如果使用字面量的方式赋值,使用static final修饰的话,则显式赋值通常是在链接阶段的准备环节进行
  • 在初始化阶段<clinit>()中赋值的情况: 排除上述的在准备环节赋值的情况之外的情况。

最终结论:使用static+final修饰,且显式赋值中不涉及到方法或构造器调用的基本数据类到或String类型的显式赋值,是在链接阶段的准备环节进行。

1. public static final int INT_CONSTANT = 10;                                // 在链接阶段的准备环节赋值
2. public static final int NUM1 = new Random().nextInt(10);                  // 在初始化阶段clinit>()中赋值
3. public static int a = 1;                                                  // 在初始化阶段<clinit>()中赋值
4. 
5. public static final Integer INTEGER_CONSTANT1 = Integer.valueOf(100);     // 在初始化阶段<clinit>()中赋值
6. public static Integer INTEGER_CONSTANT2 = Integer.valueOf(100);           // 在初始化阶段<clinit>()中概值
7. 
8. public static final String s0 = "helloworld0";                            // 在链接阶段的准备环节赋值
9. public static final String s1 = new String("helloworld1");                // 在初始化阶段<clinit>()中赋值
10. public static String s2 = "hellowrold2";                                  // 在初始化阶段<clinit>()中赋值

<clinit>()的线程安全性

对于<clinit>()方法的调用,也就是类的初始化,虚拟机会在内部确保其多线程环境中的安全性。

虚拟机会保证一个类的()方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()方法,其他线程都需要阻塞等待,直到活动线程执行<clinit>()方法完毕。

正是因为函数<clinit>()带,因此,如果在一个类的<clinit>()方法中有耗时很长的操作,就可能造成多个线程阻塞,引发死锁。并且这种死锁是很难发现的,因为看起来它们并没有可用的锁信息。

如果之前的线程成功加载了类,则等在队列中的线程就没有机会再执行<clinit>()方法了。那么,当需要使用这个类时,虚拟机会直接返回给它已经准备好的信息。

相关文章
|
9天前
|
安全 Java
JVM的类的生命周期
JVM的类的生命周期
|
7天前
|
编译器 数据安全/隐私保护 C++
【类与对象】封装&对象的初始化及清理
【类与对象】封装&对象的初始化及清理
|
18天前
|
Java 编译器 容器
浅谈类的加载过程
浅谈类的加载过程
11 3
|
19天前
|
监控 安全 Java
JVM工作原理与实战(七):类的生命周期-初始化阶段
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了类的生命周期、类的初始化阶段等内容。
24 5
|
19天前
|
存储 监控 安全
JVM工作原理与实战(五):类的生命周期-加载阶段
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了类的生命周期、类的加载阶段等内容。
28 5
|
2月前
|
Java 编译器
|
4月前
|
监控 安全 Java
Java反射:深入了解动态类操作
Java反射:深入了解动态类操作
71 0
|
5月前
将生命周期方法添加到类中
将生命周期方法添加到类中
|
10月前
|
缓存 Java 开发者
一文解读类的加载过程(类的生命周期)(下)
一文解读类的加载过程(类的生命周期)(下)
|
11月前
|
存储 安全 Java
说说类加载的过程
说说类加载的过程
54 0