一,运行时数据区共享区域—方法区
1,方法区的基本概述
方法区和堆一样,也是属于运行时数据区中的共享区域,并且也属于重要的一个内存空间,该空间主要是配合堆栈一起工作。
如下面这行代码,new User就是存在Java堆中,第一个User就是存在方法区中,第二个user就是作为局部变量表存储在栈中。
User user = new User(); #方法区:User #栈:user #堆:new User();
《Java虚拟机规范》中明确说明:“尽管所有的方法区在逻辑上是属于堆的一部分,但一些简单的实现可能不会选择区进行垃圾回收或者进行压缩”。但是对于HotSpot虚拟机而言,方法区还有一个别名就叫做Non-Heap(非堆),目的就是要和堆分开。因此,方法区可以看做是一块独立于Java堆的内存空间
🎄 方法区和java堆一样,属于是各个线程共享的区域
🎄 方法区在Jvm启动的时候被创建,他的物理内存和堆一样可以是不连续的
🎄 方法区的大小和堆空间一样,可以选择固定大小或者可扩展
🎄 方法区的大小决定了系统可以保存多少个类,如果系统定义了太多的类,导致方法区溢出,虚拟机同样会抛出内存溢出错误,如加载大量的第三方jar包,Tomcat部署的工程过多,大量的动态反射类等
🎄 关闭JVM之后,就会释放这个区域的内存
2,方法区的演进过程
这里主要是针对HotSpot虚拟机,在JDK8以前,习惯将方法区称为永久代;从JDK8开始,使用了这个元空间取代了永久代。就相当于把这个方法区当成是一个接口,而永久代和元空间就是该接口的具体实现。
In JDK8,classes metadata is now stored in the navite heap and this space is called MetaSpace
方法区和这个永久代并不等价,《Java虚拟机规范》对如何实现方法区,不做统一的要求。
到了这个 JDK8 之后,终于完全废弃了永久代的概念,改用JRockit、J9一样在本地内存中实现的元空间来代替。
元空间的本质和永久代类似,都是JVM规范中方法区实现的,不过元空间与永久代最大的区别在于:元空间不在虚拟机设置的内存中,而是使用的是本地内存。
永久代和元空间二者不只是名字变了,内部结构也调整了,根据《java虚拟机规范》的规定,如果方法区无法满足新的内存分配需求时,将抛出OOM异常。
3,方法区大小设置与OOM
方法区的大小不必是固定的,jvm可以根据应用的需要动态调整。
3.1,方法区内存大小的分配
在jdk1.8之前
🎄 可以通过 -XX:PermSize 来设置永久代初始的分配空间,默认值为20.75M
🎄 通过 -XX:MaxPermSize 来设置永久代最大的分配空间,32位机器默认是64M,64位机器为82M
🎄 当JVM加载的类信息容量超过了这个值,会报异常OutOfMemoryError:PermGen
在jdk1.8及以后
🎄 元数据区大小可以使用参数 -XX:MetaspaceSize 和 -XX:MaxMetaspaceSize 设置原始值和最大值
🎄 默认值依赖平台,windows下 -XX:MetaspaceSize 为21M,-XX:MaxMetaspaceSize 为-1,即没有限制
🎄 默认情况下,虚拟机会耗尽所有内存,如果元数据区溢出,虚拟机会抛异常OutofMemoryError:Metaspace
🎄 当内存高于设置的21M时,就会触发Full GC,Full GC就会卸载掉没用的类
🎄 因此建议将这个初始内存设置一个相对较高的值,以免频繁触发Full GC
3.2,OOM的解决方案
要解决这些OOM异常或者heap space异常,一段手段是通过内存印象分析工具堆dump出来的堆转存储快照进行分析,重点是确认内存中的对象是否是必要的,也就是要分清楚是出现了内存泄漏还是内存溢出。
如果是内存泄漏,可进一步通过工具查看泄漏对象到GC Roots的引用链,于是就能找到泄漏对象是通过怎样的路径与GC Roots相关联。在掌握了泄漏对象的信息,以及GC Roots引用链之后,就可以准确的定位到泄漏代码的位置了。
如果不存在内存泄漏,换句话就是说内存中的对象确实是还活着,那么就应该检查虚拟机的参数,与机器内存相比看是否还可以调大,从代码上检查是否存在某些对象的生命周期过长,持有时间过长等情况,从而减少运行期间的内存消耗。
4,方法区的内部结构
4.1,方法区存储数据概述
在将 .java 文件编译成 .class字节码文件之后,这个字节码文件是需要存储的,而类本身的一些信息,则需要存储在这个方法区里面,除了类信息之外,这个运行时常量池也是存储在这个方法区里面的。
在《深入理解Java虚拟机》这本书中,对方法区存储内容的概述如下:它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等。 但是随着JDK的不断迭代,其内存存储的东西也会有着稍小的变化。
类型信息:对加载的类型,包括类class、接口interface、枚举enum、注解annotation等,JVM必须在方法区中存储以下类型
♟ 这个类型的完整有效名称,全名就是 包名.类名
♟ 直接父类的完整有效名,interface和Object都是没有父类的
♟ 这个类型的修饰符,如public、static、final、abstract
♟ 直接接口的一个有序列表,如这个类可能实现多个接口
属性信息:域的相关信息主要包括以下:域名称、域类型、域修饰符等
方法信息:方法信息主要包括一些方法名称、返回类型、参数的数量和类型、方法的修饰符、方法的字节码、局部变量表以及其大小、异常表等
4.2,static final
在静态变量中,一般是随着累的加载而加载,他们成为类数据在逻辑上的一部分,并且类变量被类所有的实例共享,即使类实例不存在也可以进行访问。
而被声明的final的类变量的处理方法则不同,该变量在编译阶段就会被分配了;而没有被声明final的类变量,在准备阶段进行初步的赋值,在初始化阶段进行一个最终的赋值。
如写一个Java测试类,定义一个被final修饰的类变量和不被final修饰的类变量,并且这个类型为基础数据类型
public class Test { public static final int i = 10; public static int k = 20; public static void main(String[] args) { System.out.println(i+k); } }
然后在编译好的文件中,输入反编译命令,并将最终输出的文件加载到zhs.txt文件中
javap -v -p Test.class > zhs.txt
接下来重点分析这两个变量,可以发现这个加了final修饰的i,在编译阶段就进行了分配,赋值为10;而没有加final修饰的k,在编译阶段没有赋予默认值,而是在准备阶段赋值的默认值,在初始化阶段赋予的最终值
public static final int i; descriptor: I flags: ACC_PUBLIC, ACC_STATIC, ACC_FINAL ConstantValue: int 10 public static int k; descriptor: I flags: ACC_PUBLIC, ACC_STATIC
4.3,运行时常量池
4.3.1,什么是常量池
一个有效的字节码文件除了包含类的版本信息、字段、方法以及接口等描述信息之外,还包含一项重要的信息,那就是常量池表(Constant Pool Table),其中包括各种字面量和对类型,字段和方法的符号引用,如下
Constant pool: #1 = Methodref #6.#27 // java/lang/Object."<init>":()V #2 = Fieldref #28.#29 // java/lang/System.out:Ljava/io/PrintStream; #3 = Class #30 // com/fc/v2/util/Test #4 = Fieldref #3.#31 // com/fc/v2/util/Test.k:I
一个Java源文件在编译之后会产生一个字节码文件,而字节码文件需要数据支持,通常这种数据量很大不能直接存储到字节码文件里面,因此就通过常量池的方式,提前将数据存储在常量池中,然后根据引用去获取对应的数据,如在栈帧的 动态链接 就是通过这种方式来获取数据的。
在常量池中存储的数据类型主要有:数量值,字符串值,类引用,字段引用,方法引用
常量池就可以看做成是一张表,虚拟机指令根据这张常量表找到执行的类名、方法名、参数类型和字面量等类型。
4.3.2,什么是运行时常量池
上面提到了常量池,常量池是字节码文件的一部分,用于存放编译期生成的各个字面量和符号引用,这部分内容在类加载之后存放到方法区的运行时常量池中;而运行时常量池是属于方法区的一部分,接下来详细的描述一下上面是运行时常量池
⚽ 在将类和接口加载到虚拟机之后,就会创建对应的运行时常量池
⚽ JVM会为每个已加载的类型都维护一个常量池,池中的数据可以通过索引访问
⚽ 运行时常量池包含多种不同的常量,包括编译期就已经明确的数值,如栈帧的大小,以及运行期间才能获取到的方法或者字段引用,此时不再是常量池中的符号地址#,而是具体的真实地址。
⚽ 运行时常量池具备动态性,如实际大小可能比计算的大小大
⚽ 当创建接口或者类的运行时常量池时,如果构造的运行时常量池所需要的内存空间超过了方法区所能提供的最大值,则JVM就会抛出OutOfMemoryError异常
5,方法区的使用
接下来查看一段简单的代码,如下
/** * @author zhenghuisheng * @date : 2023/4/4 */ public class Test { public static void main(String[] args) { int x = 500; int y = 100; int a = x/y; int b = 50; System.out.println(a+b); } }
然后编译之后,通过jclasslib插件查看对应的字节码,在前面的章节又讲如何安装使用
其对应的字节码文件如下
0 sipush 500 3 istore_1 4 bipush 100 6 istore_2 7 iload_1 8 iload_2 9 idiv 10 istore_3 11 bipush 50 13 istore 4 15 getstatic #2 <java/lang/System.out> 18 iload_3 19 iload 4 21 iadd 22 invokevirtual #3 <java/io/PrintStream.println> 25 return
这个具体的操作流程如下,由于没有new对象,因此在下图中暂时先不展示堆空间。
首先程序计数器的记录的地址为0,并将这个500这个数值压入到操作数栈中。
然后就是这个istore_1,将操作数栈中存储的值存储到本地变量表中。而这个本地变量表,如果是实例方法或者是构造方法,第一个数据存储的应该是this,而这里的是static的静态方法,因此第一个slot存储的不是this。
后续的操作和上面的一样,这个iload_1就是将数据从本地变量本中取出来放到操作数栈顶,iload_2原理一样,然后结果这个idiv除法运算,将结果5存放在本地变量表3的位置
随后就是将50入栈,也存储到本地变量表中4的位置,然后通过这个getstatic #2,就是获取常量池中的#2的位置,然后最终可以获取到这个System类,out类和对应的type属性,然后加载到方法区中。如果这些类或者属性在方法区中存在就不会进行加载,如果不存在就会将这些加载到方法区中,然后将这些#等符号的间接引用变成地址的直接引用。
然后通过这个iload3和iload4将本地变量表的数据加载到操作数栈中
然后再经过iadd计算,再调用这个invokevirtual #3的符号引用,最终可以定位到一个打印操作,最终return结束
通过上图可以发现,无论是在哪一个操作,程序计数器都会指向对应的执行位置。
6,方法区的演进细节
在虚拟机中,只有HotSpot虚拟机才有永久代,JRockit和J9是不存在永久代的概念的。在HotSpot虚拟机的方法区变化如下(方法区是一种概念,永久代和元空间属于具体实现):
在jdk6及以前:有永久代,静态变量存放在永久代上面
在jdk7中:有永久代,但逐步去除,字符串常量池、静态变量保存在堆中
在jdk8及以后:无永久代,类型信息、字段、方法、常量保存在本地内存的元空间中,字符串常量池和静态变量在堆中
6.1,方法区的具体实现以及内部组成的演进
jdk6的方法区的组成如下,也称为永久代,其静态变量,运行时常量池,字符串常量池等都是保存在这个永久代的里面,并且字符串常量池是属于运行时常量池的一部分
而在jdk7开始,就将字符串常量池和静态变量存放在堆里面
而从jdk8开始,永久代已经不存在了,取而代之的是本地内存的 元空间,会将运行时常量池,类信息等全部存储在本地内存中,并且静态变量和字符串常量池都是存储在堆中
在官方文档中https://openjdk.org/jeps/122,也提到过这个删除这个永久代的动机,如下,主要就是说参考了这个 JRockit 内部的实现,这样用户可以不必自己去配置这个永久代。这样这块空间可以不用jvm本身去管理,从而交给本地内存区实现。
This is part of the JRockit and Hotspot convergence effort. JRockit customers do not need to configure the permanent generation (since JRockit does not have a permanent generation) and are accustomed to not configuring the permanent generation.
其实这项改动还是很有必要的,接下来从两个方面来说明为啥要替换
永久代的空间大小设置是很难确定的,在某些场景下,如果动态的加载类过多,就很容易出现OOM,比如一些Web项目。而元空间和永久代之间最大的区别在于:元空间不在虚拟机中,而是使用的是本地内存,因此元空间的大小只受本地内存限制
永久代的调优比较困难
6.2,字符串常量池为何要存储到堆中
在jdk7的时候,将静态变量和字符串常量池都存储到了堆中,其主要原因是在永久代中,其触发的回收效率很低,在full gc的时候才会触发。而full gc的老年代空间不足,或者永久代空间不足时才会触发,因此这就导致了这个字符串常量池的回收率不高。
而在如今的开发中,可能会创建大量的字符串,如果还是存储在方法区内部,那么其回收率会比较低,很容易导致永久代的内存不足,因此选择将这个字符串常量池存放到堆中,这样就可以快速的实现内存回收。
7,方法区的垃圾回收机制
在运行时数据区中,方法区又被称为non-heap,就是非堆的意思。并且在《java虚拟机规范》中描述,对方法区中的约束是非常宽松的,提到过不要求虚拟机在方法区中实现垃圾回收
一般来说这个区域的回收效果比较难令人满意,但是有时又确实是有必要的,因此在HotSpot虚拟机中,方法区的垃圾回收主要是回收两部分内容:常量池中废弃的常量和不再使用的类型
常量回收的策略就是只要该常量没有被任何地方引用,就可以被回收,回收废弃常量和回收Java堆的对象非常类似
类型回收的条件相对比较苛刻,需要同时的满足以下三点条件:
该类的实例被回收,该类以及对应的子类在堆中不存在
该类的类加载器已被回收
该类的Class对象没有任何地方被引用,无法在任何地方通过反射访问到该类
满足这三点条件也不是一定会进行回收,而是可能被允许回收。在大量的使用反射、动态代理、CGLib这些字节码框架,动态生成Jsp等这些场景中,通常需要java虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的压力。