【Java虚拟机】JVM垃圾回收机制和常见回收算法原理

简介: 【Java虚拟机】JVM垃圾回收机制和常见回收算法原理

1.垃圾回收机制

(1)什么是垃圾回收机制(Garbage Collection, 简称GC)

  • 指自动管理动态分配的内存空间的机制,自动回收不再使用的内存,以避免内存泄漏和内存溢出的问题
  • 最早是在1960年代提出的,程序员需要手动管理内存的分配和释放
  • 这往往会导致内存泄漏和内存溢出等问题,同时也增加了程序员的工作量,特别是C++/C语言开发的时候
  • Java语言是最早实现垃圾回收机制的语言之一,其他编程语言,如C#、Python和Ruby等,也都提供了垃圾回收机制

(2)JVM自动垃圾回收机制

  • Java虚拟机在运行Java程序时,自动回收不再使用的对象所占用的内存空间的过程
  • Java程序中的对象,一旦不再被引用会被标记为垃圾对象,JVM会在适当的时候自动回收这些垃圾对象所占用的内存空间
  • 优点
  • 减少了程序员的工作量,不需要手动管理内存
  • 动态地管理内存,根据应用程序的需要进行分配和回收,提高了内存利用率
  • 避免内存泄漏和野指针等问题,增加程序的稳定性和可靠
  • 缺点
  • 垃圾回收会占用一定的系统资源,可能会影响程序的性能
  • 垃圾回收过程中会停止程序的执行,可能会导致程序出现卡顿等问题
  • 不一定能够完全解决内存泄漏等问题,需要在编写代码时注意内存管理和编码规范

(3)引用计数法

  • 基本思想,跟踪每个对象被引用的次数,当引用次数为0时,就可以将该对象回收
  • 在JVM中,每个对象都有一个引用计数器,当对象被引用时,引用计数器+1
  • 当对象被取消引用时,引用计数器-1
  • 当引用计数器为0时,该对象就可以被回收

  • 优点
  • 实现简单,回收垃圾的效率高
  • 缺点
  • 循环引用无法回收。如果两个对象互相引用,它们的引用计数器永远不会为0,因此无法被回收
  • 引用计数器开销大,每个对象都需要一个引用计数器,如果对象很多,开销就会很大

2d0ffdedf6824c7ba7f1981611e4f392.jpg

public class Main {
    public static void main(String[] args) {
        A a = new A();
        B b = new B();
        a.setB(b);
        b.setA(a);
        a = null;
        b = null;
        System.gc();
    }
}
class A {
    private B b;
    public void setB(B b) {
        this.b = b;
    }
}
class B {
    private A a;
    public void setA(A a) {
        this.a = a;
    }
}
  • 类A和类B相互引用,每个对象都持有对方的引用,形成了一个循环引用的环,当Main方法执行完毕后,a和b对象都置为null
  • 由于它们相互引用,它们的引用计数器都不为0,无法被垃圾回收器回收,导致内存泄漏
  • 但是上面代码却不会发生内存泄漏,因为多数jvm没有采用这个引用计数器方案,而是采用可达性分析算法

(4)可达性分析算法

  • 可达性分析算法的基本思想是通过一系列的“GC Roots”对象作为起点进行搜索。
  • 如果“GC Roots”和一个对象之间没有可达路径,则称该对象是不可达的,不过要注意的是被判定为不可达的对象不一定就会成为可回收对象。
  • 被判定为不可达的对象要成为回收对象,要至少经历两次标记过程。
  • 如果在这两次标记过程中仍然没有逃脱成为可回收对象的可能性,则基本上就真的成为可回收对象了。

通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为“引用链”,当一个对象到 GC Roots 没有任何的引用链相连时(从 GC Roots 到这个对象不可达)时,证明此对象不可用。


7e2ac7d717514d628e84ce9cea405457.jpg(5)什么是GC Root

  • 指一些被JVM认为是存活的对象,它们是垃圾回收算法的起点
  • 可以理解为由堆外指向堆内的引用, 本身是没有存储位置,都是字节码加载运行过程中加入 JVM 中的一些普通引用
  • 通俗的例子可以是一个树形结构,树的根节点就是GC Roots
  • 是垃圾回收器的起点,如果一个节点没有任何子节点与根节点相连,那这个节点就被认为是不可达的,可以被回收器回收
  • (6)JVM中的GCRoots对象有哪几种
  • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  • 方法区中类静态属性引用的对象
  • JDK 1.7 开始静态变量的存储从方法区移动到堆中
  • 比如你定义了一个static 的集合对象,那里面添加的对象就是可以被GC Root可达的
  • 方法区中常量引用的对象
  • 字符串常量池从 JDK 1.7 开始由方法区移动到堆中
  • 本地方法栈中JNI(即一般说的Native方法)引用的对象。

(7)对象可回收,就一定会被回收吗?

  • 不一定会回收,对象的finalize方法给了对象一次最后一次的机会。
  • 当对象不可达(可回收)并发生 GC 时,会先判断对象是否执行了 finalize 方法,如果未执行则会先执行 finalize 方法
  • 将当前对象与 GC Roots 关联,执行 finalize 方法之后,GC 会再次判断对象是否可达
  • 如果不可达,则会被回收,如果可达,则不回收!
  • 需要注意的是 finalize 方法只会被执行一次,如果第一次执行 finalize 方法,对象变成了可达,则不会回收
  • 但如果对象再次被 GC,则会忽略 finalize 方法,对象会被直接回收掉!

2.垃圾回收算法

(1)垃圾回收算法之标记-清除算法

  • 是一种常见的垃圾回收算法,它的基本思路是分为两个阶段:标记阶段和清除阶段
  • 标记阶段
  • 垃圾回收器会从一些GC Roots对象开始,遍历整个对象图,标记所有被引用的对象
  • 被标记的对象会被打上标记,表示这些对象是“活”的对象,需要保留下来,未被标记的对象就是垃圾对象,可以被回收
  • 清除阶段
  • 垃圾回收器会对所有未被标记的对象进行回收

40d5b6b169324edeaa2d8d0c97558137.jpg

  • 优点
  • 能够回收不连续的内存空间
  • 缺点
  • 标记和清除两个步骤,都需要垃圾回收器遍历整个对象图,耗费时间较长
  • 会产生内存碎片,当频繁进行垃圾回收时,内存碎片会越来越多导致可用内存空间不足,从而影响程序的性能和稳定性
  • 应用场景
  • 在实际应用中,标记清除法一般用于不需要频繁进行垃圾回收的场景,比如在Java堆中大对象的分配和回收
  • 后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进

(2)垃圾回收算法之标记-复制算法

  • 标记算法是一种常见的垃圾回收算法,它的基本思路是将Java堆分为两个区域:一个活动区域和一个空闲区域
  • 在垃圾回收过程中,首先标记所有被引用的对象

然后将所有被标记的对象复制到空闲区域中,最后交换两个区域的角色,完成垃圾回收

标记复制算法的详细实现步骤

将Java堆分为两个区域:一个活动区域和一个空闲区域,初始时,所有对象都分配在活动区域中

从GC Roots对象开始,遍历整个对象图,标记所有被引用的对象

对所有被标记存活的对象进行遍历,将它们复制到空闲区域中,并更新所有指向它们的引用,使它们指向新的地址

对所有未被标记的对象进行回收,将它们所占用的内存空间释放

交换活动区域和空闲区域的角色,空闲区域变为新的活动区域,原来的活动区域变为空闲区域

当空闲区域的内存空间不足时,进行一次垃圾回收,重复以上步骤。

7834a0e7c0b148df829ac7f42c052e0d.jpg

  • 优点
  • 如果内存中的垃圾对象较多,需要复制的对象就较少,则效率高
  • 清理后,内存碎片少
  • 缺点
  • 标记复制算法的效率较高,但是预留一半的内存区域用来存放存活的对象,占用额外的内存空间

如果出现存活对象数量比较多的时候,需要复制较多的对象 效率低

假如是在老年代区域,99%的对象都是存活的,则性能底,所以老年代不适合这个算法

应用场景


标记复制算法一般用于新生代的垃圾回收,因此需要对新生代的对象进行分代管理


虚拟机多数采用这个算法,对新生代进行内存管理,因为多数这个新生代区域的存活对象数量少


国外有公司统计过多数业务,98%撑不过一次GC; 所以不用1:1比例分配新生代的空间


原因


GC时, 将Eden和Survivor中存活对象一次性复制到另外一块Survivor空间上, 然后清理掉Eden和已用过的那块Survivor空间

每次新生代中可用内存空间为整个新生代容量的90% (Eden的80% + Survivor的 10%) ,

只有一个Survivor空间, 即10%的新生代是会被浪费而已

e506b0f7241c4801b26da774556ac72c.jpg(3)垃圾回收算法之标记-整理算法

  • 从根节点开始对所有可达对象做一次标记,但之后并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端
  • 然后清理边界外的垃圾,避免了碎片的产生,也不需要两块相同的内存空间,因此性价比比较高

678faf50ede947269adda5bcdbf73577.jpg

  • 优点
  • 解决了标记清除算法的碎片化的问题

对比标记-复制算法,不用浪费额外的空间

对比 标记-清除算法与标记-整理算法,前者是一种非移动式的回收算法, 而后者是移动式的回收,且没有了碎片化内存

缺点

效率相比于标记复制算法低一些

在整理存活对象时,因对象位置的变动,需要该调整虚拟机栈中的引用地址

应用场景

标记-压缩算法是一种老年代的回收算法,它在标记-清除算法的基础上做了一些优化。

(4)垃圾回收算法之分代收集算法

  • 针对不同生命周期的对象采用不同的垃圾回收策略,以达到更好的垃圾回收效果
  • 年轻代多数对象存活时间短,高频进行回收;老年代多数对象存活时间久,进行低频回收
  • 分代算法是根据回收对象的特点进行选择,年轻代适合标记-复制算法,老年代适合标记清除或标记压缩算法
  • 通过将内存划分为不同的代,可以使得Minor GC的频率更高,更早地回收垃圾对象,减少Full GC的发生频率,提高整体性能


6b04eb8ba6e2420aa05be707d850a2f9.jpg

JVM将内存分为年轻代和老年代,其中年轻代又分为Eden区和两个Survivor区

年轻代

用于存放新生的对象,其中Eden区是新对象的分配区域

当Eden区满时,会触发Minor GC,将存活的对象移动到Survivor区,同时清空Eden区

Survivor区则用于存放经过一次Minor GC后存活的对象

老年代

用于存放长时间存活的对象,当年轻代中的对象经过多次Minor GC后仍然存活,就会被移动到老年代

当老年代满时,会触发Full GC

GC的分类和专业术语

部分收集(Partial GC)

新生代收集

对象从Young 区域消失的过程称为”minor GC / Young GC “

Eden 的清理,S0\S1的清理都由于MinorGC

YoungGen区内存不足,会触发minorGC

老年代收集

对象从老年代中消失的过程,清理整合OldGen的内存空间,称为**”Major GC/Old GC“**

有些垃圾收集器 针对老年代单独回收,所以比较少用

整堆收集(Full GC)

是清理整个堆空间,包括年轻代和老年代

理解为Major GC+Minor GC组合后进行的一整个过程,是清理JVM整个堆空间

FullGC触发场景

手工调用System.gc( ), 建议执行Full GC,不一定会执行,可通过-XX:+ DisableExplicitGC 参数来禁止调用System.gc()

老年代空间不足 , 通过Minor GC后进入老年代的平均大小大于老年代的可用内存

STW(Stop The World)

垃圾回收发生过程中,用户线程在运行至安全点(safe point)后,就自行挂起进入暂停状态,对外的表现就是卡顿

所以应尽量减少Full GC的次数,是Minor GC还是Major GC都会STW,区别只在于STW的时间长短


相关文章
|
1月前
|
Java
jvm复习,深入理解java虚拟机一:运行时数据区域
这篇文章深入探讨了Java虚拟机的运行时数据区域,包括程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区、元空间和运行时常量池,并讨论了它们的作用、特点以及与垃圾回收的关系。
60 19
jvm复习,深入理解java虚拟机一:运行时数据区域
|
22天前
|
存储 监控 算法
美团面试:说说 G1垃圾回收 底层原理?说说你 JVM 调优的过程 ?
尼恩提示: G1垃圾回收 原理非常重要, 是面试的重点, 大家一定要好好掌握
美团面试:说说 G1垃圾回收 底层原理?说说你 JVM 调优的过程  ?
|
13天前
|
存储 Dart Java
Dart 虚拟机运行原理
【10月更文挑战第20天】Dart 虚拟机通过一系列复杂的机制和操作,确保 Dart 代码能够准确、高效地执行。它为 Dart 语言的广泛应用提供了坚实的基础和可靠的运行环境
19 6
|
14天前
|
存储 算法 Java
Java虚拟机(JVM)的内存管理与性能优化
本文深入探讨了Java虚拟机(JVM)的内存管理机制,包括堆、栈、方法区等关键区域的功能与作用。通过分析垃圾回收算法和调优策略,旨在帮助开发者理解如何有效提升Java应用的性能。文章采用通俗易懂的语言,结合具体实例,使读者能够轻松掌握复杂的内存管理概念,并应用于实际开发中。
|
23天前
|
存储 算法 Java
深入理解Java虚拟机(JVM)及其优化策略
【10月更文挑战第10天】深入理解Java虚拟机(JVM)及其优化策略
36 1
|
2月前
|
存储 算法 Java
深入解析 Java 虚拟机:内存区域、类加载与垃圾回收机制
本文介绍了 JVM 的内存区域划分、类加载过程及垃圾回收机制。内存区域包括程序计数器、堆、栈和元数据区,每个区域存储不同类型的数据。类加载过程涉及加载、验证、准备、解析和初始化五个步骤。垃圾回收机制主要在堆内存进行,通过可达性分析识别垃圾对象,并采用标记-清除、复制和标记-整理等算法进行回收。此外,还介绍了 CMS 和 G1 等垃圾回收器的特点。
104 0
深入解析 Java 虚拟机:内存区域、类加载与垃圾回收机制
|
1月前
|
前端开发 Java 应用服务中间件
JVM进阶调优系列(1)类加载器原理一文讲透
本文详细介绍了JVM类加载机制。首先解释了类加载器的概念及其工作原理,接着阐述了四种类型的类加载器:启动类加载器、扩展类加载器、应用类加载器及用户自定义类加载器。文中重点讲解了双亲委派机制,包括其优点和缺点,并探讨了打破这一机制的方法。最后,通过Tomcat的实际应用示例,展示了如何通过自定义类加载器打破双亲委派机制,实现应用间的隔离。
|
3月前
|
Java 数据安全/隐私保护 Windows
【Azure Developer】使用Java代码启动Azure VM(虚拟机)
【Azure Developer】使用Java代码启动Azure VM(虚拟机)
|
3月前
|
存储 Java API
【Azure Developer】通过Azure提供的Azue Java JDK 查询虚拟机的CPU使用率和内存使用率
【Azure Developer】通过Azure提供的Azue Java JDK 查询虚拟机的CPU使用率和内存使用率
|
24天前
|
存储 安全 Java
jvm 锁的 膨胀过程?锁内存怎么变化的
【10月更文挑战第3天】在Java虚拟机(JVM)中,`synchronized`关键字用于实现同步,确保多个线程在访问共享资源时的一致性和线程安全。JVM对`synchronized`进行了优化,以适应不同的竞争场景,这种优化主要体现在锁的膨胀过程,即从偏向锁到轻量级锁,再到重量级锁的转变。下面我们将详细介绍这一过程以及锁在内存中的变化。
35 4