概述
在详细讲述类加载机制之前, 我们先了解一下JVM的内存结构图, 通过内存结构图,再理解类加载中的相关细节就会简单很多。
内存结构图
根据内存简图。 我们可以知道,Java中我们书写的Java类通过编译成为字节码文件(Class Files), 然后就会到达类加载子系统
通过类加载子系统加载完成后,就会加载到内存中去
下面是详细的内存结构图
注意:方法区只有HotSpot虚拟机有,J9,JRockit都没有
虚拟机 == 类加载器 + 执行引擎
通过上述的内存详细结构图我们可以得知,类加载子系统也分为三个阶段。 加载、链接、初始化。
下面我们就来详细的了解一下这些阶段要完成的事情, 以及完成这些阶段需要具备什么条件等等。至于剩余的部分, 后续会慢慢学习了解。
类加载的时机
首先,让我们看看类的生命周期
通过图片可以知道, 类的整个生命周期将会经历加载 (Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化 (Initialization)、使用(Using)和卸载(Unloading)七个阶段。
在这个七个阶段中, 每个阶段都为发挥着类的对应作用。
一般情况下, 加载 (Loading)、验证(Verification)、准备(Preparation)、初始化 (Initialization)、卸载(Unloading)
这五个阶段是按照顺序按部就班的开始执行的。而解析阶段则不一定, 在某些情况下, 它可以在初始化之后再开始。当然,这里的开始执行并不是说就一定会完成 或者 按部就班的进行, 这些阶段通常都是相互交叉地混合进行的, 会在一个阶段执行的过程中 执行或者调用另一个阶段。
对于加载 (Loading)阶段而言, 它是由虚拟机的具体实现来自由把控的。
但是对于初始化阶段《Java虚拟机规范》中明确表示只有六种情况必须对类立即进行初始化:
遇到new、getstatic、putstatic或invokestatic这四条字节码指令时,如果类型没有进行过初始 化,则需要先触发其初始化阶段。能够生成这四条指令的典型Java代码场景有:
使用new关键字实例化对象的时候。
读取或设置一个类型的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外) 的时候。
调用一个类型的静态方法的时候。
使用java.lang.reflect包的方法对类型进行反射调用的时候,如果类型没有进行过初始化,则需 要先触发其初始化。
当初始化类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先 初始化这个主类。
当使用JDK 7新加入的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解 析结果为REF_getStatic、REF_putStatic、REF_invokeStatic、REF_newInvokeSpecial四种类型的方法句 柄,并且这个方法句柄对应的类没有进行过初始化,则需要先触发其初始化。
当一个接口中定义了JDK 8新加入的默认方法(被default关键字修饰的接口方法)时,如果有 这个接口的实现类发生了初始化,那该接口要在其之前被初始化。
类加载的过程
加载
“加载”(Loading)阶段是整个“类加载”(Class Loading)过程中的一个阶段。是狭义上的加载, 而类加载是广义上的加载。
通过, 加载得到的内容 存放在方法区的内存空间(其中还存放有运行时的常量池信息)
在加载阶段,Java虚拟机需要完成以下三件事情:
通过一个类的全限定名来获取定义此类的二进制字节流。
将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入 口。
获取加载文件的方式
从ZIP压缩包中读取,这很常见,最终成为日后JAR、EAR、WAR格式的基础。
从网络中获取,这种场景最典型的应用就是Web Applet。
运行时计算生成,这种场景使用得最多的就是动态代理技术,在java.lang.reflect.Proxy中,就是用 了ProxyGenerator.generateProxyClass()来为特定接口生成形式为“*$Proxy”的代理类的二进制字节流。
由其他文件生成,典型场景是JSP应用,由JSP文件生成对应的Class文件。
从数据库中读取,这种场景相对少见些,例如有些中间件服务器(如SAP Netweaver)可以选择 把程序安装到数据库中来完成程序代码在集群间的分发。
可以从加密文件中获取,这是典型的防Class文件被反编译的保护措施,通过加载时解密Class文 件来保障程序运行逻辑不被窥探。
……
相对于类加载过程的其他阶段,非数组类型的加载阶段(准确地说,是加载阶段中获取类的二进制字节流的动作)是开发人员可控性最强的阶段。加载阶段既可以使用Java虚拟机里内置的引导类加载器来完成,也可以由用户自定义的类加载器去完成
开发人员通过自动定义类加载器来定义类加载器去控制字节 流的获取方式(重写一个类加载器的findClass()或loadClass()方法),实现根据自己的想法来赋予应用 程序获取运行代码的动态性。
验证
目的是确保Class文件的字节流中包含的信息符合《Java虚 拟机规范》的全部约束要求,保证这些信息被当作代码运行后不会危害虚拟机自身的安全。
相对而言,验证阶段是我们开发人员基本上是不会做其他操作的, 但是对于虚拟机而言, 他为了保护自身的安全, 所以会做一系列的保护措施。 具体有
文件格式验证
元数据验证
字节码验证
符号引用验证
使用BinaryViewer软件查看字节码文件,其开头均为 CA FE BA BE ,如果出现不合法的字节码文件,那么将会验证不通过。
准备
准备阶段 是正式为类中定义的变量(即静态变量,被static修饰的变量)分配内存并设置类变量初始值的阶段
这里不包含用final修饰的static, 因为被final修饰后 在编译阶段就会被分配。
这里不会也为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中
代码:变量a在准备阶段会赋初始值,但不是1,而是0,在初始化阶段会被赋值为 1
public class HelloApp { private static int a = 1;//prepare:a = 0 ---> initial : a = 1 public static void main(String[] args) { System.out.println(a); } }
解析
解析阶段 是 Java虚拟机将常量池内的符号引用替换为直接引用的过程
解析阶段往往伴随着JVM在执行完初始化之后再执行
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT Class info、CONSTANT Fieldref info、CONSTANT Methodref info等
符号引用
符号引用(Symbolic References):符号引用以一组符号来描述所引用的目标,符号可以是任何 形式的字面量,只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的内存布局无关,引 用的目标并不一定是已经加载到虚拟机内存当中的内容。各种虚拟机实现的内存布局可以各不相同, 但是它们能接受的符号引用必须都是一致的,因为符号引用的字面量形式明确定义在《Java虚拟机规 范》的Class文件格式中。
直接引用
直接引用(Direct References):直接引用是可以直接指向目标的指针、相对偏移量或者是一个能 间接定位到目标的句柄。直接引用是和虚拟机实现的内存布局直接相关的,同一个符号引用在不同虚 拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经在虚拟机 的内存中存在。
初始化
类的初始化阶段是类加载过程的最后一个步骤。
除了在加载阶段用户应用程序可以通过自动逸类加载器的方式局部参与外, 其他的动作都是完全由Java虚拟机来主导控制的。直到初始化阶段, Java虚拟机才真正开始执行类中编写的Java代码程序, 然后将主导权交给应用程序。