JVM扫盲
一:故事背景
最近在回顾JVM的基本知识,今天在这里总结一下,JVM的基础知识。方便之后再次进行回顾。
二:知识点主要构成
2.1 JVM为什么能跨平台
1.JVM类似于软件。不同系统上的JVM是不一样的,但是却提供了相同的功能。
2.JVM执行的是字节码文件,也就是.java 编译后生成的.class 文件。这样做的好处是可以很好的提高执行效率。
2.2 JVM整体结构
jvm整体结构宏观如下,每一部分我都进行了表明,下面将会详细讲解,每一部分的作用。
2.1 类加载子系统
2.1.1 概述
类加载子系统主要分为三个步骤,分别是 加载、链接、初始化。其中链接最为重要。链接主要分为三个部分,分别是 验证、准备、解析。这里重点解释一下什么叫做:“将符号引用解析为直接引用”。
在Java里,Java类和其成员都表示为 符号引用。不涉及到具体的内存地址或者方法指针。当Java程序在JVM上运行的时候,符号引用要被解析为直接引用,以便在运行的时候可以正确的找到对应的类、方法、字段。
2.1.2 具体类加载器
Java中提供的类加载器主要分为 2类四种。
1.引导类加载器
引导类加载器(BootStrapClassLoader),一般由C或者C++语言编写,直接与操作系统交互,我们一般不对齐进行操作
2.自定义类加载器
Java提供了2中自定义类加载器,通过实现(ClassLoader类)进行实现,分别是 ExtClassLoader、APPClassLoader、加载器。不同的类加载器负责加载不同的目录。
2.1.3 双亲委派机制
作用:避免类重复加载、防止核心API被篡改。
概述:加载类的时候,先提交给其父类进行类加载。一直提交给 BootStrapClassLoader,如果都无法加载指定类,才由自己进行加载。
2.1.4 Tomcat为什么要自定义类加载器
JVM判断一个类是不是已经加载的逻辑是:类名+对应的类加载器实例
如果Tomcat直接使用APPClassLoader类进行加载类的话,会出现多个项目中同名的类无法进行加载的情况。
例如我们有项目A和项目B,项目A内有一个类其全称为com.test.Hello.class,项目B中同样有一个类为com.test.Hello.class。如果使用同一个APPClassLoader,会导致只能加载一个的情况。Tomcat针对这种情况为每个应用都设置了自己单独的类加载器 WebappClassLoader 这样两个应用中的Hello.class类都会分别进行加载,不会产生冲突。
2.2 运行时数据区
2.2.1 整体概念
根据上面颜色的不同,将其分成了线程共享和线程隔离的两大部分。其中方法区和堆是多个线程共享的。
方法栈和本地方法栈,程序计数器。都不会被多个线程共享。每个线程独立的进行管理,管理自己的方法的调用过程。
2.2.2 程序计数器的作用
1.PC Register,程序计数寄存器,建成程序计数器。它是物理寄存器的抽象实现。用来记录待执行的下一条指令的地址。
2.其实程序控制流的指示器,循环、if else、异常处理、线程恢复,都依赖其完成。
2.2.3 虚拟机栈(Java栈、Java方法栈)
java方法执行的过程中,不停的将方法对应的栈帧压入栈中。执行完之后,将会将栈帧进行出栈。
什么是栈帧:
局部变量表存储了定义的每个变量。
操作数栈用来记录要进行操作的数。
这里给一个小例子,用来方便理解操作数栈
public static void main(String[] args) { int a = 10; int b = 20; int c = a+b; }
在执行操作的时候,会先将树放到操作数栈内,然后根据不同的指令将操作数放入到局部变量表,不同的变量具体对应的变量内。
2.2.4 本地方法栈
概念:
在Java中定义,但是由其它语言实现的方法。例如:native method方法。
2.2.5 堆以及堆中的各个区域作用
2.2.5.1 概念:
JVM规范中规定所有的对象和数组都该存放在堆中,在执行字节码指令时,将创建的对象存入堆中,对象对应的引用地址存入虚拟机栈中的栈帧中。
当方法执行完之后,创建的对象不会马上回收,而是等到jvm后台执行GC后,对象才会被回收。
2.2.5.2 堆内存设置:
-Xms:(memory start),用来指定初始化内存的大小。
-Xmx:(memory max),指定堆的最大内存大小。
一般会把 -Xms和-Xmx的值设置为一样,这样Jvm在GC之后,就不需要去修改堆内的内存大小了
我们可以自己实践来查看指定的堆的大小
启动jar包:
java -XX:NativeMemoryTracking=summary -Xms1024m -Xmx1024m -jar jar包路径
使用jcmd命令查看
//1.jcmd 查看进程号 jcmd //2. 根据进程号查看堆的使用情况 jcmd 进程id VM.native_memory summary
2.2.5.3 堆初始化大小:
初始化内存大小:物理内存/64
最大内存大小:物理内存/4
2.2.5.4 新生代与老年代
新生代存放的是刚刚创建的对象
老年代存放的是经过多次GC之后,仍然存在的对象
新生代与老年代默认的比例为 1:2 ,一遍不需要调整,除非明确知道存活时间较久的对象更多,则需要调大老年代占比。
2.2.5.5 对象流转过程
新生代分为三块区域,分别是 Eden、S0、S1。三块区域,新对象创建出来,会先放到Eden区内,当进行一次Youg GC之后,剩余的对象将会转移到S0,并且增加一个GC次数的表示。在阈值到达之前,都会在S0-S1,反复转移。知道达到GC的阈值,才会进入老年代。
如果创建的大对象,从Eden区域出来之后,无法放入 S0,S1,区域,对象在经历过一次GC之后,将会直接进入老年代。
如果创建的是超大对象,无法放入Eden区的话,创建的对象将会直接存入老年代。
2.3 垃圾回收
2.3.1 概念
垃圾指的是JVM中,没有任何引用指向它的对象。如果不清理这些垃圾对象,那么它们就会一直占用内存,而无法给其他对象使用,最终垃圾对象越来越多,直到OOM。
2.3.2 寻找垃圾对象方法
引用计数法:
每个对象都保存一个引用计数器属性,用户记录对象被引用的次数。
实现起来简单,但是需要额外的空间来存储引用数,维护引用数。并且无法处理循环引用问题。
可达性分析法:
从GCRoot开始,寻找到可达对象,不可达的就是失去引用的对象。
GCRoot:
正在执行的方法的参数、局部变量引用的对象
本地方法栈正在执行的方法的参数、局部变量所对应对象的引用
方法区中保存的类的静态属性对应的对象引用
方法区中保存的类信息中的常量属性对应的对象引用
2.3.3 垃圾回收算法
标记-清除算法:
- 非常基础,常用的垃圾回收算法。分为两个阶段。
- 标记阶段:从GCRoot 开发遍历,找打可达对象,并且在对象头中标记
- 清除阶段:堆内存空间进行线性遍历,如果发现对象头中未标记为可达对象,则进行回收
存在问题:效率不高,会产生内存碎片问题。由于回收过后,内存是不连续的,新加入的大的对象可能无法存放
复制算法:
将内存空间分为两块,每次使用其中一块,在进行垃圾回收时,将可达对象复制到没有被使用的内存块中,然后再清除当前内存块的对象。后续按照相同的流程进行垃圾回收。
这种算法解决了标记清除算法,存在的碎片问题。
如果可达对象比较多,垃圾对象少,复制算法效率就比较低。其适合新生代的垃圾回收。
始终有一半空间是空闲的。可能需要频繁修改栈内引用指向的堆内对象的地址。
标记整理算法:
- 结合了标记清除和复制算法的优点。首先标记可达对象,将所有存活对象移动到内存的一段,最后清理边界外所有空间
算法对比:
- | 标记-清除 | 标记-整理 | 复制 |
速度 | 中能 | 最慢 | 最快 |
空间开销 | 少(有碎片) | 少(无碎片) | 最多 |
移动对象 | 否 | 是 | 是 |
2.3.4 常见的垃圾回收器
三:总结提升
本文总结了Java的JVM虚拟机的整体结构,以及各个结构对应的大概功能,此文章正如标题所说,是属于扫盲篇。希望大家看完之后,能对整个JVM的整个结构,各个结构功能有想应的了解。如果大家感兴趣,还请持续关注我,接下来会更新一些JVM其它相关知识。