上篇文章深入浅出JVM(十二)之垃圾回收算法讨论了垃圾回收算法,为了能够更加充分的理解后续的垃圾收集器,本篇文章将深入浅出解析垃圾回收算法的相关细节,如:STW、枚举根节点如何避免长时间STW、安全点与安全区、跨代引用引起的GC Root扫描范围增大等问题
HotSpot垃圾回收算法细节
STW
Stop The Word
STW: GC中为了分析垃圾过程确保一致性,会导致所有Java用户线程停顿
可达性分析算法枚举根节点导致STW
因为不停顿线程的话,在分析垃圾的过程中引用会变化,这样分析的结果会不准确
根节点枚举
枚举GC Roots的过程是耗时的,因为要找到栈上的Reference作为根节点,这就不得不对整个栈进行扫描
为了避免枚举根节点耗费太多时间,使用OopMap(Ordinary Object Pointer普通对象指针)数据结构来记录reference引用位置
根节点枚举必须暂停用户线程,因为要保证一致性的快照(根节点枚举是用户线程停顿的重要原因)
如果单纯遍历GC Roots和引用链过程会非常的耗时,使用OopMap记录引用所在位置,扫描时不用去方法区全部扫描
使用OopMap快速,精准的让HotSpot完成根节点枚举
安全点与安全区域
safe point
代码中引用的位置可能发生变动,每时每刻更新OopMap的开销是非常大的,因此规定在安全点位置才更新OopMap
那什么位置才是安全点呢?
安全点所在的位置一般具有让程序长时间执行的特征,比如方法调用、循环、异常跳转等
由于只有安全点位置的OopMap是有效的,因此在进行GC时用户线程需要停留在安全点
让用户线程到最近的安全点停下来的方式有两种,分别是抢先式中断、主动式中断
抢先式中断: 垃圾收集发生时,中断所有用户线程,如果有用户线程没在安全点上就恢复它再让它执行会到安全点上
主动式中断: 设置一个标志位,当要发生垃圾回收时,就把这个标记位设置为真,用户线程执行时会主动轮询查看这个标志位,一旦发现它为真就去最近的安全点中断挂起
hotspot选择主动式中断,使用内存保护陷阱方式将轮循标志位实现的只有一条汇编指令,高效
安全点设立太多会影响性能,设立太少可能会导致GC等待时间太长
安全点保证程序线程执行时,在不长时间内就能够进入垃圾收集过程的安全点
safe region
安全点只能保证程序线程执行时,在不长时间内进入安全点,如果是Sleep或者Blocking的线程呢?
安全区域:确保某一段代码中,引用关系不发生变化,这段区域中任意地方开始垃圾收集都是安全的
sleep、blocking线程需要停留在安全区才能进行GC
用户线程执行到安全区,会标识自己进入安全区,垃圾回收时就不会去管这些标识进入安全区的线程
用户线程要离开安全区时,会去检查是否执行完根节点枚举,执行完了就可以离开,没执行完就等待,直到收到可以离开的信号(枚举完GC Roots)
记忆集与卡表
前面说到过分代收集的概念,比如GC可能是只针对年轻代的,但年轻代对象可能引用老年代,对了可达性分析的正确性可能要将老年代也加入GC Roots的扫描范围中,这无疑又增加了一笔开销
上述问题叫做跨代引用问题,跨代引用问题不仅仅只存在与年轻代与老年大中,熟悉G1、低延迟ZGC、Shenandoah收集器的同学会知道它们分区region也会存在这种跨代引用
使用记忆集来记录存在跨代引用的情况,当发生跨代引用时只需要将一部分跨代引用的加入GC Roots的扫描范围,而不用全部扫描
可以把记忆集看成记录从非收集区指向收集区的指针集合
常用卡表实现记忆集的卡精度(每个记录精确到内存区,该区域有对象有跨代指针)
卡表简单形式是一个字节数组,数组中每个元素对应着其标识内存区域中一块特定大小的内存区(这块内存区叫:卡页)
如果卡页上有对象含有跨代指针,就把对应卡表数组值改为1(卡表变脏),1说明卡表对应的内存块有跨代指针,把卡表数组上元素为1的内存块加入GC Roots中一起扫描(图中卡表绿色位置表示卡表变脏存在跨代引用)
记忆集解决跨代引用问题,缩减GC Roots扫描范围
写屏障
维护卡表变脏应该放在跨代引用赋值之后,使用写屏障来在跨代引用赋值操作后进行更新卡表
这里的写屏障可以理解为AOP,在赋值完成后进行更新卡表的状态
更新卡表操作产生额外的开销,在高并发情况下还可能发生伪共享问题,降低性能
可以不采用无条件的写屏障,先检查卡表标记,只有未被标记过时才将其标记为变脏,来避免伪共享问题,但会增加额外判断的开销
-XX:+UseCondCardMark 是否开启卡表更新条件判断,开启增加额外判断的开销,可以避免伪共享问题
总结
本篇文章围绕垃圾回收算法细节深入浅出解析STW、根节点枚举避免长时间STW、安全区与安全区域、记忆集解决跨代引用增大GC Root扫描范围、维护卡表的写屏障等
为了避免用户线程改变引用关系,能够正确的进行可达性分析,需要stop the word 停止用户线程
枚举GC Roots时为了避免长时间的STW,使用OopMap记录引用位置,避免扫描方法区
由于引用关系的变化,实时更新维护OopMap的开销是很大的,只有在循环、异常跳转、方法调用位置的安全点才更新OopMap,因此只有在安全点中才能正确的进行GC
安全区可以看成扩展的安全点,在一块代码中不会改变引用关系;对于sleep、blocking状态的用户线程来说,只需要在安全区就能够进行GC
hotspot采用主动轮循式中断,用户线程运行时主动轮循判断是否需要进行GC,需要进行GC则到附近最近的安全点/区,GC时不会管理这些进入安全区的用户线程,当用户线程要离开安全区时检查是否枚举完GC Root,枚举完则可以离开否则等待
跨代引用可能增加GC Root扫描范围,使用卡表实现记忆集管理跨代引用,当卡表中的卡页变脏时说明那块内存存在跨代引用,需要加入扫描范围;记忆集有效减少了扫描范围
使用类似AOP的写屏障维护卡表状态,高并发情况下可能出现伪共享问题,可以开启增加额外条件判断再进行维护卡表状态,增加条件判断开销但可以避免伪共享问题
最后
- 参考资料
- 《深入理解Java虚拟机》
本篇文章将被收入JVM专栏,觉得不错感兴趣的同学可以收藏专栏哟~
觉得菜菜写的不错,可以点赞、关注支持哟~
有什么问题可以在评论区交流喔~