三、垃圾收集器类型

简介: 收集算法是内存回收的方法论,那么垃圾回收器是内存回收的具体实现。本次讨论的收集器基于JDK1.7之后的HotSpot虚拟机。在谈垃圾收集器的上下文语境中,它们可以解释如下。并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。并发(Concurrent):指用户线程和垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行,而垃圾收集程序运行于另一个CPU上。

收集算法是内存回收的方法论,那么垃圾回收器是内存回收的具体实现。本次讨论的收集器基于JDK1.7之后的HotSpot虚拟机。

在谈垃圾收集器的上下文语境中,它们可以解释如下。

并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。

并发(Concurrent):指用户线程和垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行,而垃圾收集程序运行于另一个CPU上。

一、Serial(串行GC)收集器

这个收集器是一个单线程的收集器,这个“单线程”的意义不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是它在进行垃圾收集时,必须暂停其他所有的用户线程,直到它收集结束,所以它这个特性也叫独占式的垃圾回收。
image.png

        Serial/Serial Old收集器运行示意图(表示Serial和Serial Old组合搭配使用)

虚拟机运行在Client模式下的默认新生代收集器,它有优于其他收集器的地方:简单并且高效,对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收起自然可以获得最高的单线程收集效率。在用户的桌面应用场景中,因此Serial收集器对于运行在Client模式下的虚拟机来说是一个很好的选择。

二、ParNew(并行GC)收集器

其实是Serial收集器的多线程版本,采用的是复制算法,除了多条线程进行垃圾收集之外,其余行为与Serial收集器完全一致。
image.png

            ParNew/Serial Old收集器运行示意图(表示ParNew和Serial Old搭配使用)

ParNew收集器除了多线程收集之外,其他与Serial收集器相比并没有太多创新之处,但它却是许多运行在Server模式下虚拟机中首选的新生代收集器,一个重要的原因是,除了Serial收集器外,目前只有ParNew能与CMS收集器配合工作。

ParNew收集器在单CPU的环境中对对不会比Serial收集器更好的效果,甚至由于存在线程交互的开销,该收集器在通过超线程技术实现的两个CPU的环境中都不能百分之百的保证可以超越Serial收集器。当然,随着可以使用的CPU的数量的增加,它对于GC是系统资源的有效利用还是很有好处的,它默认开启的收集线程数与CPU的数量相同,在CPU非常多的环境下,可以使用-XX:ParallelGCThreads 参数来限制垃圾收集的线程数。

三、Parallel Scavenge(并行回收GC) 收集器

也是新生代收集器,它也使用的是复制算法的收集器,又是并行的多线程收集器,与ParNew区别是它的关注点不同,CMS收集器关注的是垃圾回收的的时候用户线程停顿的时间,而Parallel Scavenge收集器的目标是达到一个可控制的吞吐量,吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间),虚拟机总共运行100分钟,其中垃圾收集时间1分钟,吞吐量就是99%。Parallel Scavenge是一个关注吞吐量的回收器,因此也叫“吞吐量优先”收集器。
image.png

  Parallel Scavenge/Parallel Old收集器运行示意图(表示Parallel Scavenge和Parallel Old搭配使用)

短停顿时间适用和用户交互的程序,良好的响应速度能提升用户体验,而高吞吐量则可以高效率的利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务,两个参数用于精确控制吞吐量,分别是控制最大垃圾收集器停顿时间(-XX:MaxGCPauseMillis)参数以及直接设置吞吐量大小的(-XX:GCTimeRatio)参数。

同时Parallel Scavenge收集器与ParNew收集器有一个重要的区别是,Parallel Scavenge收集器有个自适应调节策略(GC Ergonomics),打开开关参数,(-XX:+UseAdaptiveSizePolicy),打开这个参数开关后,就不需要手动指定新生代的大小(-Xmn)、Eden和Survivor区的比例、晋升老年代对象大小(-XX:PretenureSizeThreshold)等细节参数了,虚拟机系统根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种调节方式称为GC字适应的调节策略(GC Ergonomics),

四、Serial Old(串行GC)收集器

Serial Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用“标记-整理算法”,这个收集器的主要意义也是在于给Client模式下的虚拟机使用。如果在Server模式下,那么它主要有两个用途:1、一种用途在JDK1.5以及之前的版本中与Parallel Scavenge收集器搭配使用,另一种用途是作为CMS收集器的后背预案,在并发收集发生Concurrent Mode Failure时使用,
image.png

              Serial/Serial Old收集器运行示意图(表示Serial和Serial Old组合搭配使用)

五、Parallel Old(并行GC)收集器

Parallel Old是Parallel Scavenge收集器的一个老年代版本,使用多线程和“标记-整理”算法,这个收集器是在JDK1.6中才开始提供的,在此之前,如果新生代选择了Parallel Scavenge收集器,老年代除了Serial Old收集器别无选择,但是Serial Old收集器在服务端应用性能上拖累,使用了Parallel Scavenge未必能达到最大的吞吐量效果,因为单线程老年代,无法充分利用CPU的处理能力,在老年代很大而且硬件比较高级的环境中,这种组合的吞吐量甚至还不一定有ParNew加CMS组合给力。直到Paralllel Old的出现,在注重吞吐量以及CPU资源敏感的场合,可以优先使用Parallel Scavenge加Parallel Old收集器
image.png
Parallel Scavenge/Parallel Old收集器运行示意图(表示Parallel Scavenge和Parallel Old搭配使用)

六、CMS收集器

CMS收集器是以获取最短回收停顿时间为目标的垃圾收集器。现在大部分应用是B/S系统的服务端上,这类应用注重服务的响应速度,希望系统停顿时间最短,这是CMS收集器非常符合这类应用。从名字上(Concurrent Mark Sweep),使用的“标记-清除”算法,它实现的步骤分为四个,初始标记(CMS initial mark)、并发标记(CMS concurrent mark)、重新标记(CMS remark)、并发清除(CMS concurrent sweep)

其中初始标记和重新标记仍然需要“Stop the World” ,初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快。并发标记进行GC Roots Tracing 过程,而重新标记是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但比并发标记的时间稍短。
image.png

由于整个过程中耗时最长的并发标记和并发清除过程中收集线程都可以与用户线程一起工作,所以,从总体上来说,CMS收集器的垃圾回收过程是与用户线程一起并发执行。

它的优点是:并发收集、低停顿,

它的缺点是:

CMS收集器对CPU资源非常敏感,在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用了一部分线程而导致应用程序变慢,总吞吐量会降低。CMS默认启动的回收线程数是(CPU+3)/4,也就是当CPU在4个以上时,并发回收时垃圾线程不少于25%的CPU资源,并随着CPU数量的增加而下降。但是当CPU不足4个时,CMS对用户程序的影响就可能变的很大。如果本来CPU负载就比较大,还分出一半的运算能力去执行收集线程,就可能导致用户程序的执行速度忽然降低了50%。为了避免这个问题,虚拟机提供了一种“增量式并发收集器”,就是在并发标记和并发清理的时候让GC线程、用户线程交替运行,尽量减少GC线程的独占资源的时间,这样整个垃圾收集的过程会更长,但对用户程序的影响就会显的少一些,也就是速度下降没那么明显,但是增量式收集器很一般,不再提倡用户使用。

CMS收集器无法处理浮动垃圾,所谓浮动垃圾是指,由于CMS并发清理阶段用户线程还在运行着,伴随着程序运行自然就会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉它们,只好留待下一次GC时再清理掉,这一部分就叫“浮动垃圾”。因此由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,在jdk1.5默认设置CMS收集器当老年代使用了68%的空间后就会被激活,在JDK1.6中CMS收集器的启动阀值已经提升到了92%,要是CMS运行期间预留的内存无法满足程序需要,就会出现一次Concurrent Mode Failure失败,这时启动后备预案,临时启动Serial Old收集器来重新进行老年代的垃圾收集,这样停顿时间就较长了,所以使用这个参数:-XX:CMSInitiatingOccupancyFraction设置太高就容易导致大量的“Concurrent Mode Failure”失败,所以要合理设置这个值的大小。

CMS收集器还有一个缺点,CMS是基于“标记-清除”算法实现的收集器,所以他在收集结束的时候会产生大量空间碎片。空间碎片过多,会给大对象分配带来很大的麻烦,往往会出现老年代还有很大的空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发一次FullGC,为了解决这个问题,CMS收集器提供了一个-XX:+UseCMSCompactAtFullCollection开关参数(默认是开启的),用于在CMS收集器顶不住要进行FullGC时开启内存碎片的合并整理过程,还有一个参数-XX:CMSFullGCsBeforeCompaction,这参数是用于设置执行多少次不压缩的FullGC后,跟着来一次带压缩的。

七、G1收集器

G1收集器是最新的收集器,jdk1.7发布的,G1是一款面向服务端应用的垃圾收集器器,未来可以替换掉JDK1.5中发布的CMS收集器。与其他GC收集器相比,G1具备如下特点。

1、并行与并发,G1能充分利用多CPU、多核环境下硬件的优势,使用多个CPU来缩短Stop-The-World停顿时间,部分其他收集器原本需要停顿Java线程执行GC动作,G1收集器仍然可以通过并发的方式让Java程序继续进行。

2、分代收集,与其他收集器一样,分代概念在G1中仍然保留,虽然G1可以不需要其他收集器配合就能独立管理整个GC堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获得更好的收集效果

3、空间整合,与CMS使用的“标记-清理”算法不同,G1从整理来看是基于“标记-整理”算法的实现的收集器。从局部上来看是基于“复制”算法实现的。但无论如何,这两种算法都意味着G1运作期间不会产生内存空间碎片,收集后能提供能提供规整的可用内存,这有利于大对象时不会因为无法找到连续内存空间而提前触发下一次GC

4、可预测的停顿,这是G1相对于CMS的另一大优势,但是G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内。

在G1之前的其他收集器进行收集的范围都是整个新生代或者老年代,而G1不再是这样的,Java堆的内存布局与其他收集器有很大区别,它将整个java堆分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但是新生代和老年代不再是物理隔离的了,它们是一部分Region的集合。

G1收集器中的运作分为以下几个步骤:

1、初始标记(Initial Marking)

2、并发标记(Concurrent Marking)

3、最终标记(Final Marking)

4、筛选标记(Live Data Counting and Evacuation)

image.png

初始标记阶段仅仅只是标记一下GC Roots能直接关联到的对象,并且修改(TAMS)的值,让下一阶段用户程序并发运行时,能再正确可用的Region中创建对象,这个阶段需要停顿线程,但耗时很短。

并发标记是从GC Root开始对堆中对象进行可达性分析,找出存活对象,这阶段耗时较长,但可与用户线程并发执行。

最终标记阶段则是为了修正在并发标记期间因用户程序运行而导致标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在线程Remembered Set Logs里面,最终标记阶段需要把Remembered Set Logs 的数据合并到Remembered Set 中,这阶段需要停顿线程,但是可并行执行

筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划,这个阶段其实也可以做到与用户线程一起并发执行,但是因为只会后一部分Region,时间是用户可控制的,而且停顿用户线程将大幅提高收集效率。

目录
相关文章
|
存储 缓存 算法
JVM第三讲:深入理解java虚拟机之垃圾回收算法?CMS垃圾回收的基本流程?对象引用类型?
JVM第三讲:深入理解java虚拟机之垃圾回收算法?CMS垃圾回收的基本流程?对象引用类型?
232 0
|
1月前
|
算法 Java
JVM进阶调优系列(3)堆内存的对象什么时候被回收?
堆对象的生命周期是咋样的?什么时候被回收,回收前又如何流转?具体又是被如何回收?今天重点讲对象GC,看完这篇就全都明白了。
|
5月前
|
算法 Java
Java垃圾回收(Garbage Collection,GC)是Java虚拟机(JVM)的一种自动内存管理机制,用于在运行时自动回收不再使用的对象所占的内存空间
【6月更文挑战第18天】Java的GC自动回收内存,包括标记清除(产生碎片)、复制(效率低)、标记整理(兼顾连续性与效率)和分代收集(区分新生代和老年代,用不同算法优化)等策略。现代JVM通常采用分代收集,以平衡性能和内存利用率。
71 3
|
6月前
|
存储 缓存 算法
深入理解JVM - 对象分配内存
深入理解JVM - 对象分配内存
67 1
|
6月前
|
存储 缓存 算法
JVM【带着问题去学习 01】什么是JVM+内存结构+堆内存+堆内存参数(逃逸分析)
JVM【带着问题去学习 01】什么是JVM+内存结构+堆内存+堆内存参数(逃逸分析)
56 0
|
算法 Java
JVM-垃圾回收,一个对象产生到灭亡的过程
java中,内存运行时区域中的程序计数器、虚拟机栈、本地方法栈3个区域生命周期随着线程的生存而生存,而堆和方法区被各线程共享,这些占用空间而不被任何对象引用的对象,我们称之为垃圾(Garbage),而垃圾收集器(Garbage Collector)的工作即是通过一些列算法对这些垃圾进行清理。
151 0
|
存储 算法 Java
jvm之7种垃圾回收器解读(下)(二)
jvm之7种垃圾回收器解读(下)(二)
|
算法 Oracle Java
jvm之7种垃圾回收器解读(下)(一)
jvm之7种垃圾回收器解读(下)
|
Java
JVM垃圾回收——五种引用
如果在垃圾回收时发现内存不足,在回收软引用所指向的对象时,软引用本身不会被清理
145 0
JVM垃圾回收——五种引用
|
缓存 监控 算法
GC-Roots、对象间的引用级别、分代垃圾回收
一、GC-Roots 对象主要是在堆上分配的,我们可以把它想象成一个池子,对象不停地创建,后台的垃圾回收进程不断地清理不再使用的对象。当内存回收的速度,赶不上对象创建的速度,这个对象池子就会产生溢出,也就是我们常说的 OOM。 把不再使用的对象及时地从堆空间清理出去,是避免 OOM 有效的方法。那 JVM 是如何判断哪些对象应该被清理,哪些对象需要被继续使用呢?
162 0