深入理解 JVM(重点:双亲委派模型 + 垃圾回收算法)

简介: 深入理解 JVM(重点:双亲委派模型 + 垃圾回收算法)

一、什么是 JVM?

JVM 是 Java Virtual Machine 的简称,意为 Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统。可以认为 JVM 是一台被定制过的现实当中不存在的计算机,Java程序最终是在JVM(Java虚拟机)中运行的。

二、JVM 的执行流程

三、JVM 运行时数据区

  1. 堆(Heap):是Java程序中最大的一块内存区域,用于存储使用new关键字创建的对象实例和数组对象。
  2. 栈(Stack):为每个线程分配单独的栈空间,主要用于存储方法调用时的栈帧、局部变量等。
  3. 方法区(Method Area):主要用于存储类的结构信息(类对象)、方法元信息、常量池、静态变量等。
  4. 程序计数器(Program Counter Register):每个线程都有一个独立的程序计数器,用于存储当前线程正在执行的指令地址或下一条即将执行的指令地址。

四、JVM 类加载机制

1、类加载过程

程序要想运行,就要把依赖的“指令和数据”加载到内存中,这里主要体现为将 .class 文件加载到内存中的过程。总结为5个词就是:

  1. 加载:它通过类加载器(ClassLoader)查找并读取类的字节码文件,将其加载到内存中。加载过程中会生成一个代表该类的Class对象,用于后续操作。
  2. 验证.class文件具有明确的数据格式
  3. 准备:正式为类中定义的变量(即静态变量,被static修饰的变量)分配内存并设置类变量初始值的阶段。
  4. 解析:是 Java 虚拟机将常量池内的符号引用替换为直接引用的过程,也就是初始化常量的过程。
  5. 初始化:主要初始化静态成员、执行静态代码块、加载父类(如果存在父类)等过程。

2、双亲委派模型

在 “加载” 这个过程中涉及到类加载器的概念,JVM 中内置了三个类加载器,构成“双亲委派模型:

  1. BootStrap ClassLoader:负责加载 Java 标准库中的类
  2. Extension ClassLoader:负责加载 Sun、Oracle拓展库的类
  3. Application ClassLoader:负责加载项目中自定义类以及第三方库中的类

如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最 终都应该传送到最顶层的类加载器中,只有当父加载器反馈自己无 法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。直到在某一层加载完成进入下一环节,如果始终没有找到,则抛出异常:ClassNotFoundException

五、JVM 垃圾回收策略

JVM垃圾回收(Garbage Collection)主要用于回收不再被程序引用的内存对象。而对象又是存储在堆内存上的,因此CG的主要目标就是 ,并且 CG 是以 对象 为单位进行释放的。至于其他内存区域:

:方法调用完毕,方法的栈帧、局部变量就随着出栈操作销毁了。整个栈也是随着线程一起销毁。

方法区:主要存储类对象,很少涉及“卸载”操作。

程序计数器:只是是一个单纯的地址整数,随着线程一起销毁。

1、死亡对象的判断算法

Java堆中存放着所有的对象实例,垃圾回收器在对堆进行垃圾回收前,首先要判断这些对象哪些还存活,哪些已经"死去"。判断对象是否已"死"有主要有如下 2 种算法:

(1)引用计数算法

给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1;任何时刻计数器为0的对象就是不能再被使用的,即对象已"死"。

使用引用计数法判断对象存活的思想很简单,一般情况下判定效率也比较高,但是 引用计数法无法解决对象的循环引用问题。

(2)可达性分析法(Java 采取的方案)

把对象中的引用关系理解为一个树形结构,通过一系列称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,只要能遍历到的对象都是可达的,否则证明此对象是不可用的。

这里的GC Roots包含以下几种:

  1. 栈上引用的对象
  2. 方法区中常量池中引用的对象
  3. 方法区中静态成员引用的对象

虽然可达性分析解决了引用计数法中的 循环引用 问题,但是搜索的过程可能会消耗更多的时间,并且为了防止在搜索的过程中引用关系发生变化,会让一些业务线程暂停工作,也就是产生STW(Stop-The-World)问题。

2、垃圾回收算法

(1)标记清除

"标记-清除"算法是最基础的垃圾回收算法。算法分为"标记"和"清除"两个阶段 : 首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

标记清除算法最大的问题是会产生 内存碎片。一般在申请内存时,往往是申请整块连续的空间,而内存碎片会导致空间利用率大打折扣。

(2)复制算法

它将整个可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另一块上面,然后再把已经使用过的内存区域一次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配时也就不需要考虑内存碎片等复杂情况。

这种算法的缺陷是内存空间的利用率比较低,将最大可用空间减为原来的一般。并且如果可用内存中垃圾很少,需要保留的对象很多,此时复制成本就比较高,效率就会变低。

(3)标记整理

标记整理也可以解决内存碎片的问题,总体思路类似于顺序表删除中间元素,每次将存活对象都向一端移动,然后直接清理掉端边界以外的内存。

标记整理算法,由于每次需要挪动,因此导致效率降低。

(4)分代回收(JVM 采用)

分代算法是通过区域划分,实现不同区域(阶段)采用不同的垃圾回收策略。大量的经验表明,Java对象大多都具备朝 生夕灭的特性,一般经过一轮扫描就有大量新生代对象死去,如果一个对象存活的时间很长了,那么经验表明他将会持续存活更长的时间。

  1. 新建的对象,会放到伊甸区。当垃圾回收扫描到伊甸区后,绝大部分对象会在第一轮 GC 中被干掉。
  2. 如果伊甸区的对象熬过第一轮 GC,会通过复制算法,将存活的对象拷贝到生存区。
  3. 生存区分为两部分,大小相等,一次使用一半,垃圾回收扫描到生存区,发现垃圾,就使用复制算法,将仍然存活的对象复制到生存区的另一半。
  4. 当生存区的对象熬过若干轮 GC 后,认为年龄增长到一定程度,则进入老年区,会通过复制算法将其拷贝到老年代。
  5. 进入老年代的对象,一般都是存活时间较长的对象,死亡的概率就比新生代中小了很多,因此针对老年代的 GC 频率就会降低很多。如果某次扫描发现老年代中某个对象是垃圾,则直接使用标记整理的方式删除。
  6. 特殊情况:如果某个对象非常大,则直接进入老年代。因为大对象进行复制算法成本比较高,并且大对象不会有很多。

六、Java 虚拟机中的垃圾收集器(了解)

Java虚拟机中的三个垃圾收集器是基于以上算法的具体实现,通常会基于以上做出一些改进和优化。这里主要列举了两个:

  1. CMS(Concurrent Mark-Sweep)垃圾收集器:CMS是一种旨在减少应用程序停顿时间的垃圾收集器。它采用并发标记-清除算法,允许在大部分清除过程中应用程序继续运行。
  2. G1(Garbage-First)垃圾收集器:G1是一种面向服务端应用程序的垃圾收集器,旨在提供可控制的停顿时间和高吞吐量。它使用分代、区域化的垃圾回收策略,可以更精确地控制停顿时间。


相关文章
|
2天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
11 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
10 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
1月前
|
缓存 算法 Java
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
这篇文章详细介绍了Java虚拟机(JVM)中的垃圾回收机制,包括垃圾的定义、垃圾回收算法、堆内存的逻辑分区、对象的内存分配和回收过程,以及不同垃圾回收器的工作原理和参数设置。
55 4
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
|
29天前
|
存储 监控 算法
美团面试:说说 G1垃圾回收 底层原理?说说你 JVM 调优的过程 ?
尼恩提示: G1垃圾回收 原理非常重要, 是面试的重点, 大家一定要好好掌握
美团面试:说说 G1垃圾回收 底层原理?说说你 JVM 调优的过程  ?
|
13天前
|
机器学习/深度学习 人工智能 算法
青否数字人声音克隆算法升级,16个超真实直播声音模型免费送!
青否数字人的声音克隆算法全面升级,能够完美克隆真人的音调、语速、情感和呼吸。提供16种超真实的直播声音模型,支持3大AI直播类型和6大核心AIGC技术,60秒快速开播,助力商家轻松赚钱。AI讲品、互动和售卖功能强大,支持多平台直播,确保每场直播话术不重复,智能互动和真实感十足。新手小白也能轻松上手,有效规避违规风险。
|
14天前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
18天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
62 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 数据采集 算法
如何在一夜之间成为模型微调大师?——从零开始的深度学习修炼之旅,让你的算法功力飙升!
【10月更文挑战第5天】在机器学习领域,预训练模型具有强大的泛化能力,但直接使用可能效果不佳,尤其在特定任务上。此时,模型微调显得尤为重要。本文通过图像分类任务,详细介绍如何利用PyTorch对ResNet-50模型进行微调,包括环境搭建、数据预处理、模型加载与训练等步骤,并提供完整Python代码。通过调整超参数和采用早停策略等技巧,可进一步优化模型性能。适合初学者快速上手模型微调。
90 8
|
1月前
|
机器学习/深度学习 算法 搜索推荐
django调用矩阵分解推荐算法模型做推荐系统
django调用矩阵分解推荐算法模型做推荐系统
25 4
|
1月前
|
算法 Java
JVM进阶调优系列(4)年轻代和老年代采用什么GC算法回收?
本文详细介绍了JVM中的GC算法,包括年轻代的复制算法和老年代的标记-整理算法。复制算法适用于年轻代,因其高效且能避免内存碎片;标记-整理算法则用于老年代,虽然效率较低,但能有效解决内存碎片问题。文章还解释了这两种算法的具体过程及其优缺点,并简要提及了其他GC算法。
 JVM进阶调优系列(4)年轻代和老年代采用什么GC算法回收?