【Java虚拟机】JVM垃圾回收机制和常见回收算法原理

简介: 【Java虚拟机】JVM垃圾回收机制和常见回收算法原理

1.垃圾回收机制

(1)什么是垃圾回收机制(Garbage Collection, 简称GC)

  • 指自动管理动态分配的内存空间的机制,自动回收不再使用的内存,以避免内存泄漏和内存溢出的问题
  • 最早是在1960年代提出的,程序员需要手动管理内存的分配和释放
  • 这往往会导致内存泄漏和内存溢出等问题,同时也增加了程序员的工作量,特别是C++/C语言开发的时候
  • Java语言是最早实现垃圾回收机制的语言之一,其他编程语言,如C#、Python和Ruby等,也都提供了垃圾回收机制

(2)JVM自动垃圾回收机制

  • Java虚拟机在运行Java程序时,自动回收不再使用的对象所占用的内存空间的过程
  • Java程序中的对象,一旦不再被引用会被标记为垃圾对象,JVM会在适当的时候自动回收这些垃圾对象所占用的内存空间
  • 优点
  • 减少了程序员的工作量,不需要手动管理内存
  • 动态地管理内存,根据应用程序的需要进行分配和回收,提高了内存利用率
  • 避免内存泄漏和野指针等问题,增加程序的稳定性和可靠
  • 缺点
  • 垃圾回收会占用一定的系统资源,可能会影响程序的性能
  • 垃圾回收过程中会停止程序的执行,可能会导致程序出现卡顿等问题
  • 不一定能够完全解决内存泄漏等问题,需要在编写代码时注意内存管理和编码规范

(3)引用计数法

  • 基本思想,跟踪每个对象被引用的次数,当引用次数为0时,就可以将该对象回收
  • 在JVM中,每个对象都有一个引用计数器,当对象被引用时,引用计数器+1
  • 当对象被取消引用时,引用计数器-1
  • 当引用计数器为0时,该对象就可以被回收

  • 优点
  • 实现简单,回收垃圾的效率高
  • 缺点
  • 循环引用无法回收。如果两个对象互相引用,它们的引用计数器永远不会为0,因此无法被回收
  • 引用计数器开销大,每个对象都需要一个引用计数器,如果对象很多,开销就会很大

2d0ffdedf6824c7ba7f1981611e4f392.jpg

public class Main {
    public static void main(String[] args) {
        A a = new A();
        B b = new B();
        a.setB(b);
        b.setA(a);
        a = null;
        b = null;
        System.gc();
    }
}
class A {
    private B b;
    public void setB(B b) {
        this.b = b;
    }
}
class B {
    private A a;
    public void setA(A a) {
        this.a = a;
    }
}
  • 类A和类B相互引用,每个对象都持有对方的引用,形成了一个循环引用的环,当Main方法执行完毕后,a和b对象都置为null
  • 由于它们相互引用,它们的引用计数器都不为0,无法被垃圾回收器回收,导致内存泄漏
  • 但是上面代码却不会发生内存泄漏,因为多数jvm没有采用这个引用计数器方案,而是采用可达性分析算法

(4)可达性分析算法

  • 可达性分析算法的基本思想是通过一系列的“GC Roots”对象作为起点进行搜索。
  • 如果“GC Roots”和一个对象之间没有可达路径,则称该对象是不可达的,不过要注意的是被判定为不可达的对象不一定就会成为可回收对象。
  • 被判定为不可达的对象要成为回收对象,要至少经历两次标记过程。
  • 如果在这两次标记过程中仍然没有逃脱成为可回收对象的可能性,则基本上就真的成为可回收对象了。

通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为“引用链”,当一个对象到 GC Roots 没有任何的引用链相连时(从 GC Roots 到这个对象不可达)时,证明此对象不可用。


7e2ac7d717514d628e84ce9cea405457.jpg(5)什么是GC Root

  • 指一些被JVM认为是存活的对象,它们是垃圾回收算法的起点
  • 可以理解为由堆外指向堆内的引用, 本身是没有存储位置,都是字节码加载运行过程中加入 JVM 中的一些普通引用
  • 通俗的例子可以是一个树形结构,树的根节点就是GC Roots
  • 是垃圾回收器的起点,如果一个节点没有任何子节点与根节点相连,那这个节点就被认为是不可达的,可以被回收器回收
  • (6)JVM中的GCRoots对象有哪几种
  • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  • 方法区中类静态属性引用的对象
  • JDK 1.7 开始静态变量的存储从方法区移动到堆中
  • 比如你定义了一个static 的集合对象,那里面添加的对象就是可以被GC Root可达的
  • 方法区中常量引用的对象
  • 字符串常量池从 JDK 1.7 开始由方法区移动到堆中
  • 本地方法栈中JNI(即一般说的Native方法)引用的对象。

(7)对象可回收,就一定会被回收吗?

  • 不一定会回收,对象的finalize方法给了对象一次最后一次的机会。
  • 当对象不可达(可回收)并发生 GC 时,会先判断对象是否执行了 finalize 方法,如果未执行则会先执行 finalize 方法
  • 将当前对象与 GC Roots 关联,执行 finalize 方法之后,GC 会再次判断对象是否可达
  • 如果不可达,则会被回收,如果可达,则不回收!
  • 需要注意的是 finalize 方法只会被执行一次,如果第一次执行 finalize 方法,对象变成了可达,则不会回收
  • 但如果对象再次被 GC,则会忽略 finalize 方法,对象会被直接回收掉!

2.垃圾回收算法

(1)垃圾回收算法之标记-清除算法

  • 是一种常见的垃圾回收算法,它的基本思路是分为两个阶段:标记阶段和清除阶段
  • 标记阶段
  • 垃圾回收器会从一些GC Roots对象开始,遍历整个对象图,标记所有被引用的对象
  • 被标记的对象会被打上标记,表示这些对象是“活”的对象,需要保留下来,未被标记的对象就是垃圾对象,可以被回收
  • 清除阶段
  • 垃圾回收器会对所有未被标记的对象进行回收

40d5b6b169324edeaa2d8d0c97558137.jpg

  • 优点
  • 能够回收不连续的内存空间
  • 缺点
  • 标记和清除两个步骤,都需要垃圾回收器遍历整个对象图,耗费时间较长
  • 会产生内存碎片,当频繁进行垃圾回收时,内存碎片会越来越多导致可用内存空间不足,从而影响程序的性能和稳定性
  • 应用场景
  • 在实际应用中,标记清除法一般用于不需要频繁进行垃圾回收的场景,比如在Java堆中大对象的分配和回收
  • 后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进

(2)垃圾回收算法之标记-复制算法

  • 标记算法是一种常见的垃圾回收算法,它的基本思路是将Java堆分为两个区域:一个活动区域和一个空闲区域
  • 在垃圾回收过程中,首先标记所有被引用的对象

然后将所有被标记的对象复制到空闲区域中,最后交换两个区域的角色,完成垃圾回收

标记复制算法的详细实现步骤

将Java堆分为两个区域:一个活动区域和一个空闲区域,初始时,所有对象都分配在活动区域中

从GC Roots对象开始,遍历整个对象图,标记所有被引用的对象

对所有被标记存活的对象进行遍历,将它们复制到空闲区域中,并更新所有指向它们的引用,使它们指向新的地址

对所有未被标记的对象进行回收,将它们所占用的内存空间释放

交换活动区域和空闲区域的角色,空闲区域变为新的活动区域,原来的活动区域变为空闲区域

当空闲区域的内存空间不足时,进行一次垃圾回收,重复以上步骤。

7834a0e7c0b148df829ac7f42c052e0d.jpg

  • 优点
  • 如果内存中的垃圾对象较多,需要复制的对象就较少,则效率高
  • 清理后,内存碎片少
  • 缺点
  • 标记复制算法的效率较高,但是预留一半的内存区域用来存放存活的对象,占用额外的内存空间

如果出现存活对象数量比较多的时候,需要复制较多的对象 效率低

假如是在老年代区域,99%的对象都是存活的,则性能底,所以老年代不适合这个算法

应用场景


标记复制算法一般用于新生代的垃圾回收,因此需要对新生代的对象进行分代管理


虚拟机多数采用这个算法,对新生代进行内存管理,因为多数这个新生代区域的存活对象数量少


国外有公司统计过多数业务,98%撑不过一次GC; 所以不用1:1比例分配新生代的空间


原因


GC时, 将Eden和Survivor中存活对象一次性复制到另外一块Survivor空间上, 然后清理掉Eden和已用过的那块Survivor空间

每次新生代中可用内存空间为整个新生代容量的90% (Eden的80% + Survivor的 10%) ,

只有一个Survivor空间, 即10%的新生代是会被浪费而已

e506b0f7241c4801b26da774556ac72c.jpg(3)垃圾回收算法之标记-整理算法

  • 从根节点开始对所有可达对象做一次标记,但之后并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端
  • 然后清理边界外的垃圾,避免了碎片的产生,也不需要两块相同的内存空间,因此性价比比较高

678faf50ede947269adda5bcdbf73577.jpg

  • 优点
  • 解决了标记清除算法的碎片化的问题

对比标记-复制算法,不用浪费额外的空间

对比 标记-清除算法与标记-整理算法,前者是一种非移动式的回收算法, 而后者是移动式的回收,且没有了碎片化内存

缺点

效率相比于标记复制算法低一些

在整理存活对象时,因对象位置的变动,需要该调整虚拟机栈中的引用地址

应用场景

标记-压缩算法是一种老年代的回收算法,它在标记-清除算法的基础上做了一些优化。

(4)垃圾回收算法之分代收集算法

  • 针对不同生命周期的对象采用不同的垃圾回收策略,以达到更好的垃圾回收效果
  • 年轻代多数对象存活时间短,高频进行回收;老年代多数对象存活时间久,进行低频回收
  • 分代算法是根据回收对象的特点进行选择,年轻代适合标记-复制算法,老年代适合标记清除或标记压缩算法
  • 通过将内存划分为不同的代,可以使得Minor GC的频率更高,更早地回收垃圾对象,减少Full GC的发生频率,提高整体性能


6b04eb8ba6e2420aa05be707d850a2f9.jpg

JVM将内存分为年轻代和老年代,其中年轻代又分为Eden区和两个Survivor区

年轻代

用于存放新生的对象,其中Eden区是新对象的分配区域

当Eden区满时,会触发Minor GC,将存活的对象移动到Survivor区,同时清空Eden区

Survivor区则用于存放经过一次Minor GC后存活的对象

老年代

用于存放长时间存活的对象,当年轻代中的对象经过多次Minor GC后仍然存活,就会被移动到老年代

当老年代满时,会触发Full GC

GC的分类和专业术语

部分收集(Partial GC)

新生代收集

对象从Young 区域消失的过程称为”minor GC / Young GC “

Eden 的清理,S0\S1的清理都由于MinorGC

YoungGen区内存不足,会触发minorGC

老年代收集

对象从老年代中消失的过程,清理整合OldGen的内存空间,称为**”Major GC/Old GC“**

有些垃圾收集器 针对老年代单独回收,所以比较少用

整堆收集(Full GC)

是清理整个堆空间,包括年轻代和老年代

理解为Major GC+Minor GC组合后进行的一整个过程,是清理JVM整个堆空间

FullGC触发场景

手工调用System.gc( ), 建议执行Full GC,不一定会执行,可通过-XX:+ DisableExplicitGC 参数来禁止调用System.gc()

老年代空间不足 , 通过Minor GC后进入老年代的平均大小大于老年代的可用内存

STW(Stop The World)

垃圾回收发生过程中,用户线程在运行至安全点(safe point)后,就自行挂起进入暂停状态,对外的表现就是卡顿

所以应尽量减少Full GC的次数,是Minor GC还是Major GC都会STW,区别只在于STW的时间长短


相关文章
|
1月前
|
监控 算法 Java
Java虚拟机(JVM)垃圾回收机制深度剖析与优化策略####
本文作为一篇技术性文章,深入探讨了Java虚拟机(JVM)中垃圾回收的工作原理,详细分析了标记-清除、复制算法、标记-压缩及分代收集等主流垃圾回收算法的特点和适用场景。通过实际案例,展示了不同GC(Garbage Collector)算法在应用中的表现差异,并针对大型应用提出了一系列优化策略,包括选择合适的GC算法、调整堆内存大小、并行与并发GC调优等,旨在帮助开发者更好地理解和优化Java应用的性能。 ####
40 0
|
9天前
|
算法 Java 数据库
理解CAS算法原理
CAS(Compare and Swap,比较并交换)是一种无锁算法,用于实现多线程环境下的原子操作。它通过比较内存中的值与预期值是否相同来决定是否进行更新。JDK 5引入了基于CAS的乐观锁机制,替代了传统的synchronized独占锁,提升了并发性能。然而,CAS存在ABA问题、循环时间长开销大和只能保证单个共享变量原子性等缺点。为解决这些问题,可以使用版本号机制、合并多个变量或引入pause指令优化CPU执行效率。CAS广泛应用于JDK的原子类中,如AtomicInteger.incrementAndGet(),利用底层Unsafe库实现高效的无锁自增操作。
理解CAS算法原理
|
29天前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
30天前
|
存储 人工智能 缓存
【AI系统】布局转换原理与算法
数据布局转换技术通过优化内存中数据的排布,提升程序执行效率,特别是对于缓存性能的影响显著。本文介绍了数据在内存中的排布方式,包括内存对齐、大小端存储等概念,并详细探讨了张量数据在内存中的排布,如行优先与列优先排布,以及在深度学习中常见的NCHW与NHWC两种数据布局方式。这些布局方式的选择直接影响到程序的性能,尤其是在GPU和CPU上的表现。此外,还讨论了连续与非连续张量的概念及其对性能的影响。
51 3
|
1月前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####
|
2月前
|
机器学习/深度学习 监控 算法
Java虚拟机(JVM)的垃圾回收机制深度剖析####
本文深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法、性能调优策略及未来趋势。通过实例解析,为开发者提供优化Java应用性能的思路与方法。 ####
53 1
|
2月前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
356 1
|
3月前
|
存储 安全 Java
jvm 锁的 膨胀过程?锁内存怎么变化的
【10月更文挑战第3天】在Java虚拟机(JVM)中,`synchronized`关键字用于实现同步,确保多个线程在访问共享资源时的一致性和线程安全。JVM对`synchronized`进行了优化,以适应不同的竞争场景,这种优化主要体现在锁的膨胀过程,即从偏向锁到轻量级锁,再到重量级锁的转变。下面我们将详细介绍这一过程以及锁在内存中的变化。
48 4
|
9天前
|
存储 Java 程序员
【JVM】——JVM运行机制、类加载机制、内存划分
JVM运行机制,堆栈,程序计数器,元数据区,JVM加载机制,双亲委派模型
|
2月前
|
Java
JVM内存参数
-Xmx[]:堆空间最大内存 -Xms[]:堆空间最小内存,一般设置成跟堆空间最大内存一样的 -Xmn[]:新生代的最大内存 -xx[use 垃圾回收器名称]:指定垃圾回收器 -xss:设置单个线程栈大小 一般设堆空间为最大可用物理地址的百分之80

热门文章

最新文章