HotSpot VM垃圾收集器

简介: 使用分代垃圾收集器,基于以下观察事实(弱分代假设)大多数分配对象的存活时间短存活时间久的对象很少引用存活时间短的对象由此, HotSpot VM 将堆分为两个物理区空间,这就是分代(永久代只存储元数据, eg.

使用分代垃圾收集器,基于以下观察事实(弱分代假设)

  • 大多数分配对象的存活时间短
  • 存活时间久的对象很少引用存活时间短的对象

由此, HotSpot VM 将堆分为两个物理区空间,这就是分代(永久代只存储元数据, eg. 类的数据结构,保留字符串( Interned String))

根据新生代和老年代各自的特点,我们应该分别为它们选择不同的收集器,以提升垃圾回收效率.


img_5dff63595ac0fea65c0e24a551e19876.png

1 新生代垃圾收集器

1.1 Serial垃圾收集器

单线程 Stop-The-World 式

img_5be8b589d38eecd061f5065c7c83cdb3.png

  • 单线程
    只会使用一个CPU或一条GC线程进行GC,并且在GC过程中暂停其他所有的工作线程,因此用户的请求或图形化界面会出现卡顿
  • 适合Client模式
    一般客户端应用所需内存较小,不会创建太多的对象,而且堆内存不大,因此GC时间比较短,即使在这段时间停止一切用户线程,也不会感到明显停顿
  • 简单高效
    由于Serial收集器只有一条GC线程,避免了线程切换的开销
  • 采用"复制"算法

1.2 ParNew垃圾收集器

ParNew是Serial的多线程版本.


img_cd2afc6a58a2544da04232d941e3c043.png

2.1 多线程并行执行

ParNew由多条GC线程并行地进行垃圾清理.
但清理过程仍然需要暂停一切其他用户线程.
但由于有多条GC线程同时清理,清理速度比Serial有一定的提升

2.2 适合多CPU的服务器环境

由于使用多线程,是许多运行在 server 模式下的虚拟机首选的新生代收集器

  • 与Serial性能对比
    ParNew和Serial唯一区别就是使用了多线程垃圾回收,在多CPU的环境下性能比Serial会有一定程度的提升
    但线程切换需要额外的开销,因此在单CPU环境中表现不如Serial,双CPU环境也不一定就比Serial高效
    默认开启的收集线程数与CPU数量相同

2.3 采用"复制"算法

2.4 追求"降低停顿时间"

和Serial相比,ParNew使用多线程的目的就是缩短GC时间,从而减少用户线程被停顿的时间

3 Parallel : 吞吐量为先!

3.1 Scavenge垃圾收集器

Parallel Scavenge和ParNew一样都是并行的多线程、新生代收集器,都使用"复制"算法(Stop-The-World)进行垃圾回收

但它们有个巨大不同点:

  • ParNew收集器追求降低GC时用户线程的停顿时间,适合交互式应用,良好的反应速度提升用户体验.
  • Parallel Scavenge追求可控的CPU吞吐量,能够在较短的时间内完成指定任务,适合不需太多交互的后台运算

吞吐量是指用户线程运行时间占CPU总时间的比例.
CPU总时间包括 : 用户线程运行时间 和 GC线程运行的时间.
因此,吞吐量越高表示用户线程运行时间越长,从而用户线程能够被快速处理完.

  • 降低停顿时间的两种方式
    1.在多CPU环境中使用多条GC线程,从而垃圾回收的时间减少,从而用户线程停顿的时间也减少;
    2.实现GC线程与用户线程并发执行。所谓并发,就是用户线程与GC线程交替执行,从而每次停顿的时间会减少,用户感受到的停顿感降低,但线程之间不断切换意味着需要额外的开销,从而垃圾回收和用户线程的总时间将会延长。

  • Parallel Scavenge提供的参数

  • -XX:GCTimeRadio
    直接设置吞吐量大小,GC时间占总时间比率.相当于是吞吐量的倒数.

  • -XX:MaxGCPauseMillis
    设置最大GC停顿时间
    Parallel Scavenge会根据这个值的大小确定新生代的大小.
    这个值越小,新生代就越小,从而收集器就能以较短时间进行一次GC
    但新生代变小后,回收的频率就会提高,吞吐量也降下来了,因此要合理控制这个值

  • -XX:+UseAdaptiveSizePolicy
    开启GC 自适应的调节策略(区别于ParNew).
    我们只要设置最大堆(-Xmx)和MaxGCPauseMillis或GCTimeRadio,收集器会自动调整新生代的大小、Eden和Survior的比例、对象进入老年代的年龄,以最大程度上接近我们设置的MaxGCPauseMillis或GCTimeRadio

3.2 Old垃圾收集器

Parallel Scavenge的老年代版本,一般它们搭配使用,追求CPU吞吐量

它们在垃圾收集时都是由多条GC线程并行执行,并暂停一切用户线程,使用"标记-整理"算法.因此,由于在GC过程中没有使垃圾收集和用户线程并行执行,因此它们是追求吞吐量的垃圾收集器.


img_2f6380ce11a4215ed8a1f59102444fcc.png

老年代垃圾收集器

1 Serial Old垃圾收集器

Serial的老年代版本,都是单线程收集器,GC时只启动一条GC线程,因此都适合客户端应用.

它们唯一的区别就是

  • Serial Old工作在老年代,使用"标记-整理"算法
  • Serial工作在新生代,使用"复制"算法.


    img_5be8b589d38eecd061f5065c7c83cdb3.png

4 CMS垃圾收集器(Concurrent Mark- Sweep) : 低延迟为先!

对许多应用来说,快速响应比端到端的吞吐量更为重要

管理新生代的方法与 parallel 和 serial 相同
在老年代则尽可能并发执行,每个 GC 周期只有2次短的停顿

一种追求最短停顿时间的收集器
在GC时使得用户线程和GC线程并发执行,因此在GC过程中用户也不会感受到明显卡顿
但用户线程和GC线程之间不停地切换会有额外的开销,因此垃圾回收总时间就会被延长
垃圾回收过程
前两步需要"Stop The World"

  • 初始标记 (Initial Mark)
    停止一切用户线程,仅使用一条初始标记线程对所有与GC Roots直接相关联的 老年代对象进行标记,速度很快
  • 并发标记 (Concurrent Marking Phase)
    使用多条并发标记线程并行执行,并与用户线程并发执行.此过程进行可达性分析,标记所有这些对象可达的存货对象,速度很慢
  • 重新标记 ( Remark)
    因为并发标记时有用户线程在执行,标记结果可能有变化
    停止一切用户线程,并使用多条重新标记线程并行执行,重新遍历所有在并发标记期间有变化的对象进行最后的标记.这个过程的运行时间介于初始标记和并发标记之间
  • 并发清除 (Concurrent Sweeping)
    只使用一条并发清除线程,和用户线程们并发执行,清除刚才标记的对象
    这个过程非常耗时


    img_03a1a8022bdab81bf8583cb517000521.png

4.1 CMS的缺点

  • 吞吐量低
    由于CMS在GC过程用户线程和GC线程并行,从而有线程切换的额外开销
    因此CPU吞吐量就不如在GC过程中停止一切用户线程的方式来的高
  • 无法处理浮动垃圾,导致频繁Full GC
    由于垃圾清除过程中,用户线程和GC线程并发执行,也就是用户线程仍在执行,那么在执行过程中会产生垃圾,这些垃圾称为"浮动垃圾"
    如果CMS在GC过程中,用户线程需要在老年代中分配内存时发现空间不足,就需再次发起Full GC,而此时CMS正在进行清除工作,因此此时只能由Serial Old临时对老年代进行一次Full GC
  • 使用"标记-清除"算法产生碎片空间
    由于CMS使用了"标记-清除"算法, 因此清除之后会产生大量的碎片空间,不利于空间利用率.不过CMS提供了应对策略:
    • 开启-XX:+UseCMSCompactAtFullCollection
      开启该参数后,每次FullGC完成后都会进行一次内存压缩整理,将零散在各处的对象整理到一块儿.但每次都整理效率不高,因此提供了以下参数.
    • 设置参数-XX:CMSFullGCsBeforeCompaction
      本参数告诉CMS,经过了N次Full GC过后再进行一次内存整理.

5 G1收集器(Garbage-First)

G1是当今最前沿的垃圾收集器成果之一.

5.1 G1的特点

  • 追求停顿时间
  • 多线程GC
  • 面向服务端应用
  • 整体来看基于标记-整理和局部来看基于复制算法合并
    不会产生内存空间碎片
  • 可对整个堆进行垃圾回收
  • 可预测的停顿时间

5.2 G1的内存模型

没有新生代和老年代的概念,而是将Java堆划分为一块块独立的大小相等的Region.
当要进行垃圾收集时,首先估计每个Region中的垃圾数量,每次都从垃圾回收价值最大的Region开始回收,因此可以获得最大的回收效率

5.3 Remembered Set

一个对象和它内部所引用的对象可能不在同一个Region中,那么当垃圾回收时,是否需要扫描整个堆内存才能完整地进行一次可达性分析?
当然不是,每个Region都有一个Remembered Set,用于记录本区域中所有对象引用的对象所在的区域,从而在进行可达性分析时,只要在GC Roots中再加上Remembered Set即可防止对所有堆内存的遍历.

5.4 G1垃圾收集过程

  • 初始标记
    标记与GC Roots直接关联的对象,停止所有用户线程,只启动一条初始标记线程,这个过程很快.
  • 并发标记
    进行全面的可达性分析,开启一条并发标记线程与用户线程并行执行.这个过程比较长.
  • 最终标记
    标记出并发标记过程中用户线程新产生的垃圾.停止所有用户线程,并使用多条最终标记线程并行执行.
  • 筛选回收
    回收废弃的对象.此时也需要停止一切用户线程,并使用多条筛选回收线程并行执行.


    img_fb345d0e786bd05dc83da96d8c5c8ec2.png
    这里写图片描述
目录
相关文章
|
6月前
|
存储 算法 Java
六、HotSpot中的垃圾收集
六、HotSpot中的垃圾收集
77 2
|
6月前
|
安全 算法 Java
HotSpot中GC算法的实现
HotSpot中GC算法的实现
37 0
|
6月前
|
Java
垃圾回收器的重要VM参数(使用-XX:)
垃圾回收器的重要VM参数(使用-XX:)
|
6月前
|
算法 Java 程序员
JVM的垃圾回收机制(GC)
JVM的垃圾回收机制(GC)
|
6月前
|
监控 算法 Java
聊聊JVM中那些垃圾收集器
聊聊JVM中那些垃圾收集器
49 0
|
Oracle Java 关系型数据库
深入理解JVM系列教程(01) - HotSpot VM
深入理解JVM系列教程(01) - HotSpot VM
264 0
|
算法 Java UED
JVM - 垃圾收集器
垃圾收集器大概可以分为: 串行垃圾收集器 并行垃圾收集器 CMS(并发)垃圾收集器
122 0
JVM - 垃圾收集器
|
监控 算法 Java
7 种 JVM 垃圾收集器详解
7 种 JVM 垃圾收集器详解
173 0
|
算法 Java
究竟什么是HotSpot 垃圾收集器
究竟什么是HotSpot 垃圾收集器
84 0
|
存储 算法 Java
必知必会JVM四-垃圾收集器介绍
必知必会JVM四-垃圾收集器介绍
70 0