深入浅出JVM(十三)之垃圾回收算法细节

简介: 深入浅出JVM(十三)之垃圾回收算法细节

上篇文章深入浅出JVM(十二)之垃圾回收算法讨论了垃圾回收算法,为了能够更加充分的理解后续的垃圾收集器,本篇文章将深入浅出解析垃圾回收算法的相关细节,如:STW、枚举根节点如何避免长时间STW、安全点与安全区、跨代引用引起的GC Root扫描范围增大等问题

HotSpot垃圾回收算法细节

STW

Stop The Word

STW: GC中为了分析垃圾过程确保一致性,会导致所有Java用户线程停顿

可达性分析算法枚举根节点导致STW

因为不停顿线程的话,在分析垃圾的过程中引用会变化,这样分析的结果会不准确

根节点枚举

枚举GC Roots的过程是耗时的,因为要找到栈上的Reference作为根节点,这就不得不对整个栈进行扫描

为了避免枚举根节点耗费太多时间,使用OopMap(Ordinary Object Pointer普通对象指针)数据结构来记录reference引用位置

根节点枚举必须暂停用户线程,因为要保证一致性的快照(根节点枚举是用户线程停顿的重要原因)

如果单纯遍历GC Roots和引用链过程会非常的耗时,使用OopMap记录引用所在位置,扫描时不用去方法区全部扫描

使用OopMap快速,精准的让HotSpot完成根节点枚举

安全点与安全区域

safe point

代码中引用的位置可能发生变动,每时每刻更新OopMap的开销是非常大的,因此规定在安全点位置才更新OopMap

那什么位置才是安全点呢?

安全点所在的位置一般具有让程序长时间执行的特征,比如方法调用、循环、异常跳转等

由于只有安全点位置的OopMap是有效的,因此在进行GC时用户线程需要停留在安全点

让用户线程到最近的安全点停下来的方式有两种,分别是抢先式中断、主动式中断

抢先式中断: 垃圾收集发生时,中断所有用户线程,如果有用户线程没在安全点上就恢复它再让它执行会到安全点上

主动式中断: 设置一个标志位,当要发生垃圾回收时,就把这个标记位设置为真,用户线程执行时会主动轮询查看这个标志位,一旦发现它为真就去最近的安全点中断挂起

hotspot选择主动式中断,使用内存保护陷阱方式将轮循标志位实现的只有一条汇编指令,高效

安全点设立太多会影响性能,设立太少可能会导致GC等待时间太长

安全点保证程序线程执行时,在不长时间内就能够进入垃圾收集过程的安全点

safe region

安全点只能保证程序线程执行时,在不长时间内进入安全点,如果是Sleep或者Blocking的线程呢?

安全区域:确保某一段代码中,引用关系不发生变化,这段区域中任意地方开始垃圾收集都是安全的

sleep、blocking线程需要停留在安全区才能进行GC

用户线程执行到安全区,会标识自己进入安全区,垃圾回收时就不会去管这些标识进入安全区的线程

用户线程要离开安全区时,会去检查是否执行完根节点枚举,执行完了就可以离开,没执行完就等待,直到收到可以离开的信号(枚举完GC Roots)

记忆集与卡表

前面说到过分代收集的概念,比如GC可能是只针对年轻代的,但年轻代对象可能引用老年代,对了可达性分析的正确性可能要将老年代也加入GC Roots的扫描范围中,这无疑又增加了一笔开销

上述问题叫做跨代引用问题,跨代引用问题不仅仅只存在与年轻代与老年大中,熟悉G1、低延迟ZGC、Shenandoah收集器的同学会知道它们分区region也会存在这种跨代引用

使用记忆集来记录存在跨代引用的情况,当发生跨代引用时只需要将一部分跨代引用的加入GC Roots的扫描范围,而不用全部扫描

可以把记忆集看成记录从非收集区指向收集区的指针集合

常用卡表实现记忆集的卡精度(每个记录精确到内存区,该区域有对象有跨代指针)

卡表简单形式是一个字节数组,数组中每个元素对应着其标识内存区域中一块特定大小的内存区(这块内存区叫:卡页)

image.png

如果卡页上有对象含有跨代指针,就把对应卡表数组值改为1(卡表变脏),1说明卡表对应的内存块有跨代指针,把卡表数组上元素为1的内存块加入GC Roots中一起扫描(图中卡表绿色位置表示卡表变脏存在跨代引用)

记忆集解决跨代引用问题,缩减GC Roots扫描范围

写屏障

维护卡表变脏应该放在跨代引用赋值之后,使用写屏障来在跨代引用赋值操作后进行更新卡表

这里的写屏障可以理解为AOP,在赋值完成后进行更新卡表的状态

更新卡表操作产生额外的开销,在高并发情况下还可能发生伪共享问题,降低性能

可以不采用无条件的写屏障,先检查卡表标记,只有未被标记过时才将其标记为变脏,来避免伪共享问题,但会增加额外判断的开销

-XX:+UseCondCardMark 是否开启卡表更新条件判断,开启增加额外判断的开销,可以避免伪共享问题

总结

本篇文章围绕垃圾回收算法细节深入浅出解析STW、根节点枚举避免长时间STW、安全区与安全区域、记忆集解决跨代引用增大GC Root扫描范围、维护卡表的写屏障等

为了避免用户线程改变引用关系,能够正确的进行可达性分析,需要stop the word 停止用户线程

枚举GC Roots时为了避免长时间的STW,使用OopMap记录引用位置,避免扫描方法区

由于引用关系的变化,实时更新维护OopMap的开销是很大的,只有在循环、异常跳转、方法调用位置的安全点才更新OopMap,因此只有在安全点中才能正确的进行GC

安全区可以看成扩展的安全点,在一块代码中不会改变引用关系;对于sleep、blocking状态的用户线程来说,只需要在安全区就能够进行GC

hotspot采用主动轮循式中断,用户线程运行时主动轮循判断是否需要进行GC,需要进行GC则到附近最近的安全点/区,GC时不会管理这些进入安全区的用户线程,当用户线程要离开安全区时检查是否枚举完GC Root,枚举完则可以离开否则等待

跨代引用可能增加GC Root扫描范围,使用卡表实现记忆集管理跨代引用,当卡表中的卡页变脏时说明那块内存存在跨代引用,需要加入扫描范围;记忆集有效减少了扫描范围

使用类似AOP的写屏障维护卡表状态,高并发情况下可能出现伪共享问题,可以开启增加额外条件判断再进行维护卡表状态,增加条件判断开销但可以避免伪共享问题

最后

  • 参考资料
  • 《深入理解Java虚拟机》

本篇文章将被收入JVM专栏,觉得不错感兴趣的同学可以收藏专栏哟~

觉得菜菜写的不错,可以点赞、关注支持哟~

有什么问题可以在评论区交流喔~

相关文章
|
9天前
|
算法 安全 Java
JVM垃圾回收算法详解
JVM垃圾回收算法详解
|
9天前
|
存储 算法 Java
技术笔记:JVM的垃圾回收机制总结(垃圾收集、回收算法、垃圾回收器)
技术笔记:JVM的垃圾回收机制总结(垃圾收集、回收算法、垃圾回收器)
|
11天前
|
监控 算法 Java
JVM之GC算法的实现(垃圾回收器)
JVM之GC算法的实现(垃圾回收器)
|
2天前
|
存储 监控 算法
JVM之垃圾回收面试总结
JVM之垃圾回收面试总结
14 0
|
9天前
|
算法 Java
《JVM由浅入深学习【八】 2024-01-12》JVM由简入深学习提升分(JVM的垃圾回收算法)
《JVM由浅入深学习【八】 2024-01-12》JVM由简入深学习提升分(JVM的垃圾回收算法)
6 0
|
10天前
|
算法 Java 云计算
JVM垃圾回收的历史演进:从GC算法到垃圾回收器选择
JVM垃圾回收的历史演进:从GC算法到垃圾回收器选择
|
11天前
|
存储 算法 安全
JVM-内存划分-垃圾回收器-回收算法-双亲委派-三色标记
JVM-内存划分-垃圾回收器-回收算法-双亲委派-三色标记
|
2天前
|
机器学习/深度学习 算法 调度
Matlab|基于改进鲸鱼优化算法的微网系统能量优化管理matlab-源码
基于改进鲸鱼优化算法的微网系统能量管理源码实现,结合LSTM预测可再生能源和负荷,优化微网运行成本与固定成本。方法应用于冷热电联供微网,结果显示经济成本平均降低4.03%,提高经济效益。代码包括数据分段、LSTM网络定义及训练,最终展示了一系列运行结果图表。
|
7天前
|
算法 安全 数据库
基于结点电压法的配电网状态估计算法matlab仿真
**摘要** 该程序实现了基于结点电压法的配电网状态估计算法,旨在提升数据的准确性和可靠性。在MATLAB2022a中运行,显示了状态估计过程中的电压和相位估计值,以及误差随迭代变化的图表。算法通过迭代计算雅可比矩阵,结合基尔霍夫定律解决线性方程组,估算网络节点电压。状态估计过程中应用了高斯-牛顿或莱文贝格-马夸尔特法,处理量测数据并考虑约束条件,以提高估计精度。程序结果以图形形式展示电压幅值和角度估计的比较,以及估计误差的演变,体现了算法在处理配电网状态估计问题的有效性。
|
4天前
|
数据采集 存储 算法
基于BP算法的SAR成像matlab仿真
**摘要:** 基于BP算法的SAR成像研究,利用MATLAB2022a进行仿真。SAR系统借助相对运动合成大孔径,提供高分辨率图像。BP算法执行回波数据预处理、像素投影及图像重建,实现精确成像。优点是高精度和强适应性,缺点是计算量大、内存需求高。代码示例展示了回波生成、数据处理到插值显示的全过程。