深入浅出JVM(十三)之垃圾回收算法细节

简介: 深入浅出JVM(十三)之垃圾回收算法细节

上篇文章深入浅出JVM(十二)之垃圾回收算法讨论了垃圾回收算法,为了能够更加充分的理解后续的垃圾收集器,本篇文章将深入浅出解析垃圾回收算法的相关细节,如:STW、枚举根节点如何避免长时间STW、安全点与安全区、跨代引用引起的GC Root扫描范围增大等问题

HotSpot垃圾回收算法细节

STW

Stop The Word

STW: GC中为了分析垃圾过程确保一致性,会导致所有Java用户线程停顿

可达性分析算法枚举根节点导致STW

因为不停顿线程的话,在分析垃圾的过程中引用会变化,这样分析的结果会不准确

根节点枚举

枚举GC Roots的过程是耗时的,因为要找到栈上的Reference作为根节点,这就不得不对整个栈进行扫描

为了避免枚举根节点耗费太多时间,使用OopMap(Ordinary Object Pointer普通对象指针)数据结构来记录reference引用位置

根节点枚举必须暂停用户线程,因为要保证一致性的快照(根节点枚举是用户线程停顿的重要原因)

如果单纯遍历GC Roots和引用链过程会非常的耗时,使用OopMap记录引用所在位置,扫描时不用去方法区全部扫描

使用OopMap快速,精准的让HotSpot完成根节点枚举

安全点与安全区域

safe point

代码中引用的位置可能发生变动,每时每刻更新OopMap的开销是非常大的,因此规定在安全点位置才更新OopMap

那什么位置才是安全点呢?

安全点所在的位置一般具有让程序长时间执行的特征,比如方法调用、循环、异常跳转等

由于只有安全点位置的OopMap是有效的,因此在进行GC时用户线程需要停留在安全点

让用户线程到最近的安全点停下来的方式有两种,分别是抢先式中断、主动式中断

抢先式中断: 垃圾收集发生时,中断所有用户线程,如果有用户线程没在安全点上就恢复它再让它执行会到安全点上

主动式中断: 设置一个标志位,当要发生垃圾回收时,就把这个标记位设置为真,用户线程执行时会主动轮询查看这个标志位,一旦发现它为真就去最近的安全点中断挂起

hotspot选择主动式中断,使用内存保护陷阱方式将轮循标志位实现的只有一条汇编指令,高效

安全点设立太多会影响性能,设立太少可能会导致GC等待时间太长

安全点保证程序线程执行时,在不长时间内就能够进入垃圾收集过程的安全点

safe region

安全点只能保证程序线程执行时,在不长时间内进入安全点,如果是Sleep或者Blocking的线程呢?

安全区域:确保某一段代码中,引用关系不发生变化,这段区域中任意地方开始垃圾收集都是安全的

sleep、blocking线程需要停留在安全区才能进行GC

用户线程执行到安全区,会标识自己进入安全区,垃圾回收时就不会去管这些标识进入安全区的线程

用户线程要离开安全区时,会去检查是否执行完根节点枚举,执行完了就可以离开,没执行完就等待,直到收到可以离开的信号(枚举完GC Roots)

记忆集与卡表

前面说到过分代收集的概念,比如GC可能是只针对年轻代的,但年轻代对象可能引用老年代,对了可达性分析的正确性可能要将老年代也加入GC Roots的扫描范围中,这无疑又增加了一笔开销

上述问题叫做跨代引用问题,跨代引用问题不仅仅只存在与年轻代与老年大中,熟悉G1、低延迟ZGC、Shenandoah收集器的同学会知道它们分区region也会存在这种跨代引用

使用记忆集来记录存在跨代引用的情况,当发生跨代引用时只需要将一部分跨代引用的加入GC Roots的扫描范围,而不用全部扫描

可以把记忆集看成记录从非收集区指向收集区的指针集合

常用卡表实现记忆集的卡精度(每个记录精确到内存区,该区域有对象有跨代指针)

卡表简单形式是一个字节数组,数组中每个元素对应着其标识内存区域中一块特定大小的内存区(这块内存区叫:卡页)

image.png

如果卡页上有对象含有跨代指针,就把对应卡表数组值改为1(卡表变脏),1说明卡表对应的内存块有跨代指针,把卡表数组上元素为1的内存块加入GC Roots中一起扫描(图中卡表绿色位置表示卡表变脏存在跨代引用)

记忆集解决跨代引用问题,缩减GC Roots扫描范围

写屏障

维护卡表变脏应该放在跨代引用赋值之后,使用写屏障来在跨代引用赋值操作后进行更新卡表

这里的写屏障可以理解为AOP,在赋值完成后进行更新卡表的状态

更新卡表操作产生额外的开销,在高并发情况下还可能发生伪共享问题,降低性能

可以不采用无条件的写屏障,先检查卡表标记,只有未被标记过时才将其标记为变脏,来避免伪共享问题,但会增加额外判断的开销

-XX:+UseCondCardMark 是否开启卡表更新条件判断,开启增加额外判断的开销,可以避免伪共享问题

总结

本篇文章围绕垃圾回收算法细节深入浅出解析STW、根节点枚举避免长时间STW、安全区与安全区域、记忆集解决跨代引用增大GC Root扫描范围、维护卡表的写屏障等

为了避免用户线程改变引用关系,能够正确的进行可达性分析,需要stop the word 停止用户线程

枚举GC Roots时为了避免长时间的STW,使用OopMap记录引用位置,避免扫描方法区

由于引用关系的变化,实时更新维护OopMap的开销是很大的,只有在循环、异常跳转、方法调用位置的安全点才更新OopMap,因此只有在安全点中才能正确的进行GC

安全区可以看成扩展的安全点,在一块代码中不会改变引用关系;对于sleep、blocking状态的用户线程来说,只需要在安全区就能够进行GC

hotspot采用主动轮循式中断,用户线程运行时主动轮循判断是否需要进行GC,需要进行GC则到附近最近的安全点/区,GC时不会管理这些进入安全区的用户线程,当用户线程要离开安全区时检查是否枚举完GC Root,枚举完则可以离开否则等待

跨代引用可能增加GC Root扫描范围,使用卡表实现记忆集管理跨代引用,当卡表中的卡页变脏时说明那块内存存在跨代引用,需要加入扫描范围;记忆集有效减少了扫描范围

使用类似AOP的写屏障维护卡表状态,高并发情况下可能出现伪共享问题,可以开启增加额外条件判断再进行维护卡表状态,增加条件判断开销但可以避免伪共享问题

最后

  • 参考资料
  • 《深入理解Java虚拟机》

本篇文章将被收入JVM专栏,觉得不错感兴趣的同学可以收藏专栏哟~

觉得菜菜写的不错,可以点赞、关注支持哟~

有什么问题可以在评论区交流喔~

相关文章
|
5天前
|
存储 算法 Java
先有JVM还是先有垃圾回收器?
是先有垃圾回收器再有JVM呢,还是先有JVM再有垃圾回收器呢?或者是先有垃圾回收再有JVM呢?历史上还真是垃圾回收更早面世,先有垃圾回收再有JVM。下面我们就来刨析刨析JVM的垃圾回收~
14 0
先有JVM还是先有垃圾回收器?
|
5天前
|
JavaScript 前端开发 算法
JavaScript的垃圾回收机制通过标记-清除算法自动管理内存
【5月更文挑战第11天】JavaScript的垃圾回收机制通过标记-清除算法自动管理内存,免除开发者处理内存泄漏问题。它从根对象开始遍历,标记活动对象,未标记的对象被视为垃圾并释放内存。优化技术包括分代收集和增量收集,以提升性能。然而,开发者仍需谨慎处理全局变量、闭包、定时器和DOM引用,防止内存泄漏,保证程序稳定性和性能。
18 0
|
5天前
|
存储 算法 Java
深入浅出JVM(十二)之垃圾回收算法
深入浅出JVM(十二)之垃圾回收算法
|
5天前
|
算法 Java PHP
JVM 的垃圾回收机制以及垃圾回收算法的详解
JVM 的垃圾回收机制以及垃圾回收算法的详解
11 0
|
5天前
|
监控 算法 安全
JVM工作原理与实战(三十九):G1垃圾回收器原理
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了G1垃圾回收器执行流程、年轻代回收原理、卡表(Card Table)、记忆集的生成流程、年轻代回收的详细步骤、混合回收的步骤、初始标记、并发标记、SATB、转移等内容。
23 0
|
5天前
|
存储 监控 算法
JVM工作原理与实战(二十七):堆的垃圾回收-G1垃圾回收器
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了G1垃圾回收器、G1垃圾回收器的回收方式、G1垃圾回收器执行流程、垃圾回收器的选择等内容。
13 0
|
5天前
|
机器学习/深度学习 监控 算法
JVM工作原理与实战(二十六):堆的垃圾回收-垃圾回收器
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了垃圾回收器、Serial垃圾回收器、SerialOld垃圾回收器、ParNew垃圾回收器、CMS垃圾回收器、Parallel Scavenge垃圾回收器、Parallel Old垃圾回收器等内容。
13 0
|
5天前
|
Arthas 监控 算法
JVM工作原理与实战(二十五):堆的垃圾回收-垃圾回收算法
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了垃圾回收算法评价标准、标记清除算法、复制算法、标记整理算法、分代垃圾回收算法等内容。
22 0
JVM工作原理与实战(二十五):堆的垃圾回收-垃圾回收算法
|
5天前
|
存储 缓存 算法
深入浅出JVM(二)之运行时数据区和内存溢出异常
深入浅出JVM(二)之运行时数据区和内存溢出异常
|
5天前
|
Java Linux Arthas
linux上如何排查JVM内存过高?
linux上如何排查JVM内存过高?
687 0