jvm(9) -- cms收集器、G1收集器

简介: jvm(9) -- cms收集器、G1收集器

1.Cms收集器


1dc618a0ed9580ce8bfa6facb208c08f.png


摘自文章:https://www.jianshu.com/p/29460c44c664


CMS(Concurrent Mark Swep)收集器是一个比较重要的回收器,现在应用非常广泛,我们重点来看一下,CMS一种获取最短回收停顿时间为目标的收集器,这使得它很适合用于和用户交互的业务。从名字(Mark Swep)就可以看出,CMS收集器是基于标记清除算法实现的。它的收集过程分为四个步骤:


1.初始标记(initial mark)


2.并发标记(concurrent mark)


3.重新标记(remark)


4.并发清除(concurrent sweep)


注意初始标记和重新标记还是会stop the world,但是在耗费时间更长的并发标记和并发清除两个阶段都可以和用户进程同时工作。


不过由于CMS收集器是基于标记清除算法实现的,会导致有大量的空间碎片产生,在为大对象分配内存的时候,往往会出现老年代还有很大的空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前开启一次Full GC。为了解决这个问题,CMS收集器默认提供了一个-XX:+UseCMSCompactAtFullCollection收集开关参数(默认就是开启的),用于在CMS收集器进行FullGC完开启内存碎片的合并整理过程,内存整理的过程是无法并发的,这样内存碎片问题倒是没有了,不过停顿时间不得不变长。虚拟机设计者还提供了另外一个参数-XX:CMSFullGCsBeforeCompaction参数用于设置执行多少次不压缩的FULL GC后跟着来一次带压缩的(默认值为0,表示每次进入Full GC时都进行碎片整理)。


不幸的是,它作为老年代的收集器,却无法与jdk1.4中已经存在的新生代收集器Parallel Scavenge配合工作,所以在jdk1.5中使用cms来收集老年代的时候,新生代只能选择ParNew或Serial收集器中的一个。ParNew收集器是使用-XX:+UseConcMarkSweepGC选项启用CMS收集器之后的默认新生代收集器,也可以使用-XX:+UseParNewGC选项来强制指定它。


摘自文章:https://www.breakyizhan.com/javamianshiti/2856.html


并发标记清理(Concurrent Mark Sweep,CMS)收集器也称为并发低停顿收集器(Concurrent Low Pause Collector)或低延迟(low-latency)垃圾收集器;


在前面ParNew收集器曾简单介绍过其特点;


①、特点


针对老年代;


基于"标记-清除"算法(不进行压缩操作,产生内存碎片);


以获取最短回收停顿时间为目标;


并发收集、低停顿;


需要更多的内存(看后面的缺点);


是HotSpot在JDK1.5推出的第一款真正意义上的并发(Concurrent)收集器;


第一次实现了让垃圾收集线程与用户线程(基本上)同时工作;


②、应用场景


与用户交互较多的场景;


希望系统停顿时间最短,注重服务的响应速度;


以给用户带来较好的体验;


如常见WEB、B/S系统的服务器上的应用;


③、设置参数


“-XX:+UseConcMarkSweepGC”:指定使用CMS收集器;


④、CMS收集器运作过程


比前面几种收集器更复杂,可以分为4个步骤:


(A)、初始标记(CMS initial mark)


仅标记一下GC Roots能直接关联到的对象;


速度很快;


但需要"Stop The World";


(B)、并发标记(CMS concurrent mark)


进行GC Roots Tracing的过程;


刚才产生的集合中标记出存活对象;


应用程序也在运行;


并不能保证可以标记出所有的存活对象;


(C)、重新标记(CMS remark)


为了修正并发标记期间因用户程序继续运作而导致标记变动的那一部分对象的标记记录;


需要"Stop The World",且停顿时间比初始标记稍长,但远比并发标记短;


采用多线程并行执行来提升效率;


(D)、并发清除(CMS concurrent sweep)


回收所有的垃圾对象;


整个过程中耗时最长的并发标记和并发清除都可以与用户线程一起工作;


所以总体上说,CMS收集器的内存回收过程与用户线程一起并发执行;


CMS收集器运行示意图如下:


1dc618a0ed9580ce8bfa6facb208c08f.png


⑤、CMS收集器3个明显的缺点


(A)对CPU资源非常敏感


并发收集虽然不会暂停用户线程,但因为占用一部分CPU资源,还是会导致应用程序变慢,总吞吐量降低。


CMS的默认收集线程数量是=(CPU数量+3)/4;


当CPU数量多于4个,收集线程占用的CPU资源多于25%,对用户程序影响可能较大;不足4个时,影响更大,可能无法接受。


增量式并发收集器:


针对这种情况,曾出现了"增量式并发收集器"(Incremental Concurrent Mark Sweep/i-CMS);


类似使用抢占式来模拟多任务机制的思想,让收集线程和用户线程交替运行,减少收集线程运行时间;


但效果并不理想,JDK1.6后就官方不再提倡用户使用。


更多请参考:


官方的《垃圾收集调优指南》8.8节 Incremental Mode:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/cms.html#CJAGIIEJ


《内存管理白皮书》 4.6.3节可以看到一些描述;


(B)无法处理浮动垃圾,可能出现"Concurrent Mode Failure"失败


(1)、浮动垃圾(Floating Garbage)

在并发清除时,用户线程新产生的垃圾,称为浮动垃圾;


这使得并发清除时需要预留一定的内存空间,不能像其他收集器在老年代几乎填满再进行收集;


也要可以认为CMS所需要的空间比其他垃圾收集器大;


“-XX:CMSInitiatingOccupancyFraction”:设置CMS预留内存空间;


JDK1.5默认值为68%;


JDK1.6变为大约92%;


(2)、"Concurrent Mode Failure"失败

如果CMS预留内存空间无法满足程序需要,就会出现一次"Concurrent Mode Failure"失败;


这时JVM启用后备预案:临时启用Serail Old收集器,而导致另一次Full GC的产生;


这样的代价是很大的,所以CMSInitiatingOccupancyFraction不能设置得太大。


(C)产生大量内存碎片


由于CMS基于"标记-清除"算法,清除后不进行压缩操作;


前面《Java虚拟机垃圾回收(二) 垃圾回收算法》"标记-清除"算法介绍时曾说过:


产生大量不连续的内存碎片会导致分配大内存对象时,无法找到足够的连续内存,从而需要提前触发另一次Full GC动作。


解决方法:


(1)、“-XX:+UseCMSCompactAtFullCollection”


使得CMS出现上面这种情况时不进行Full GC,而开启内存碎片的合并整理过程;


但合并整理过程无法并发,停顿时间会变长;


默认开启(但不会进行,结合下面的CMSFullGCsBeforeCompaction);


(2)、“-XX:+CMSFullGCsBeforeCompaction”


设置执行多少次不压缩的Full GC后,来一次压缩整理;


为减少合并整理过程的停顿时间;


默认为0,也就是说每次都执行Full GC,不会进行压缩整理;


由于空间不再连续,CMS需要使用可用"空闲列表"内存分配方式,这比简单实用"碰撞指针"分配内存消耗大;


更多关于内存分配方式请参考:《Java对象在Java虚拟机中的创建过程》


总体来看,与Parallel Old垃圾收集器相比,CMS减少了执行老年代垃圾收集时应用暂停的时间;


但却增加了新生代垃圾收集时应用暂停的时间、降低了吞吐量而且需要占用更大的堆空间;


更多CMS收集器信息请参考:


《垃圾收集调优指南》 8节 Concurrent Mark Sweep (CMS) Collector:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/cms.html#concurrent_mark_sweep_cms_collector


《内存管理白皮书》 4.6节 Concurrent Mark-Sweep (CMS) Collector:http://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf


2.G1收集器


5d4c6812c8535adbb050f4ddf2e1bce8.png


摘自:https://www.jianshu.com/p/29460c44c664


G1收集器是一款面向服务端应用的垃圾收集器。HotSpot团队赋予它的使命是在未来替换掉JDK1.5中发布的CMS收集器。与其他GC收集器相比,G1具备如下特点:


并行与并发:G1能更充分的利用CPU,多核环境下的硬件优势来缩短stop the world的停顿时间。


分代收集:和其他收集器一样,分代的概念在G1中依然存在,不过G1不需要其他的垃圾回收器的配合就可以独自管理整个GC堆。


空间整合:G1收集器有利于程序长时间运行,分配大对象时不会无法得到连续的空间而提前触发一次GC。


可预测的非停顿:这是G1相对于CMS的另一大优势,降低停顿时间是G1和CMS共同的关注点,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。


在使用G1收集器时,Java堆的内存布局和其他收集器有很大的差别,它将这个Java堆分为多个大小相等的独立区域,虽然还保留新生代和老年代的概念,但是新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。


摘自:<https://www.jianshu.com/p/29460c44c664


G1(Garbage-First)是JDK7-u4才推出商用的收集器;


①、特点


(A)、并行与并发


能充分利用多CPU、多核环境下的硬件优势;


可以并行来缩短"Stop The World"停顿时间;


也可以并发让垃圾收集与用户程序同时进行;


(B)、分代收集,收集范围包括新生代和老年代


能独立管理整个GC堆(新生代和老年代),而不需要与其他收集器搭配;


能够采用不同方式处理不同时期的对象;


虽然保留分代概念,但Java堆的内存布局有很大差别;


将整个堆划分为多个大小相等的独立区域(Region);


新生代和老年代不再是物理隔离,它们都是一部分Region(不需要连续)的集合;


更多G1内存布局信息请参考:


《垃圾收集调优指南》 9节:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc.html#garbage_first_garbage_collection


(C)、结合多种垃圾收集算法,空间整合,不产生碎片


从整体看,是基于标记-整理算法;


从局部(两个Region间)看,是基于复制算法;


这是一种类似火车算法的实现;


都不会产生内存碎片,有利于长时间运行;


(D)、可预测的停顿:低停顿的同时实现高吞吐量


G1除了追求低停顿处,还能建立可预测的停顿时间模型;


可以明确指定M毫秒时间片内,垃圾收集消耗的时间不超过N毫秒;


②、应用场景


面向服务端应用,针对具有大内存、多处理器的机器;


最主要的应用是为需要低GC延迟,并具有大堆的应用程序提供解决方案;


如:在堆大小约6GB或更大时,可预测的暂停时间可以低于0.5秒;


用来替换掉JDK1.5中的CMS收集器;


在下面的情况时,使用G1可能比CMS好:


(1)、超过50%的Java堆被活动数据占用;


(2)、对象分配频率或年代提升频率变化很大;


(3)、GC停顿时间过长(长于0.5至1秒)。


是否一定采用G1呢?也未必:


如果现在采用的收集器没有出现问题,不用急着去选择G1;


如果应用程序追求低停顿,可以尝试选择G1;


是否代替CMS需要实际场景测试才知道。


③、设置参数


“-XX:+UseG1GC”:指定使用G1收集器;


“-XX:InitiatingHeapOccupancyPercent”:当整个Java堆的占用率达到参数值时,开始并发标记阶段;默认为45;


“-XX:MaxGCPauseMillis”:为G1设置暂停时间目标,默认值为200毫秒;


“-XX:G1HeapRegionSize”:设置每个Region大小,范围1MB到32MB;目标是在最小Java堆时可以拥有约2048个Region;


更多关于G1参数设置请参考:


《垃圾收集调优指南》 10.5节:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc_tuning.html#important_defaults


④、为什么G1收集器可以实现可预测的停顿


G1可以建立可预测的停顿时间模型,是因为:


可以有计划地避免在Java堆的进行全区域的垃圾收集;


G1跟踪各个Region获得其收集价值大小,在后台维护一个优先列表;


每次根据允许的收集时间,优先回收价值最大的Region(名称Garbage-First的由来);


这就保证了在有限的时间内可以获取尽可能高的收集效率;


⑤、一个对象被不同区域引用的问题


一个Region不可能是孤立的,一个Region中的对象可能被其他任意Region中对象引用,判断对象存活时,是否需要扫描整个Java堆才能保证准确?


在其他的分代收集器,也存在这样的问题(而G1更突出):


回收新生代也不得不同时扫描老年代?


这样的话会降低Minor GC的效率;


解决方法:


无论G1还是其他分代收集器,JVM都是使用Remembered Set来避免全局扫描:


每个Region都有一个对应的Remembered Set;


每次Reference类型数据写操作时,都会产生一个Write Barrier暂时中断操作;


然后检查将要写入的引用指向的对象是否和该Reference类型数据在不同的Region(其他收集器:检查老年代对象是否引用了新生代对象);


如果不同,通过CardTable把相关引用信息记录到引用指向对象的所在Region对应的Remembered Set中;


当进行垃圾收集时,在GC根节点的枚举范围加入Remembered Set;


就可以保证不进行全局扫描,也不会有遗漏。


⑥、G1收集器运作过程


不计算维护Remembered Set的操作,可以分为4个步骤(与CMS较为相似)。


(A)、初始标记(Initial Marking)


仅标记一下GC Roots能直接关联到的对象;


且修改TAMS(Next Top at Mark Start),让下一阶段并发运行时,用户程序能在正确可用的Region中创建新对象;


需要"Stop The World",但速度很快;


(B)、并发标记(Concurrent Marking)


进行GC Roots Tracing的过程;


刚才产生的集合中标记出存活对象;


耗时较长,但应用程序也在运行;


并不能保证可以标记出所有的存活对象;


(C)、最终标记(Final Marking)


为了修正并发标记期间因用户程序继续运作而导致标记变动的那一部分对象的标记记录;


上一阶段对象的变化记录在线程的Remembered Set Log;


这里把Remembered Set Log合并到Remembered Set中;


需要"Stop The World",且停顿时间比初始标记稍长,但远比并发标记短;


采用多线程并行执行来提升效率;


(D)、筛选回收(Live Data Counting and Evacuation)


首先排序各个Region的回收价值和成本;


然后根据用户期望的GC停顿时间来制定回收计划;


最后按计划回收一些价值高的Region中垃圾对象;


回收时采用"复制"算法,从一个或多个Region复制存活对象到堆上的另一个空的Region,并且在此过程中压缩和释放内存;


可以并发进行,降低停顿时间,并增加吞吐量;


G1收集器运行示意图如下:

66ba272a0bfc97be54a5fa679e3d5482.png


更多G1收集器信息请参考:


《垃圾收集调优指南》 9节 Garbage-First Garbage Collector:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc.html#garbage_first_garbage_collection


《垃圾收集调优指南》 10节 Garbage-First Garbage Collector Tuning:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc_tuning.html#g1_gc_tuning



相关文章
|
4月前
|
存储 算法 Oracle
极致八股文之JVM垃圾回收器G1&ZGC详解
本文作者分享了一些垃圾回收器的执行过程,希望给大家参考。
|
27天前
|
存储 算法 Java
JVM进阶调优系列(10)敢向stop the world喊卡的G1垃圾回收器 | 有必要讲透
本文详细介绍了G1垃圾回收器的背景、核心原理及其回收过程。G1,即Garbage First,旨在通过将堆内存划分为多个Region来实现低延时的垃圾回收,每个Region可以根据其垃圾回收的价值被优先回收。文章还探讨了G1的Young GC、Mixed GC以及Full GC的具体流程,并列出了G1回收器的核心参数配置,帮助读者更好地理解和优化G1的使用。
|
2月前
|
缓存 算法 Java
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
这篇文章详细介绍了Java虚拟机(JVM)中的垃圾回收机制,包括垃圾的定义、垃圾回收算法、堆内存的逻辑分区、对象的内存分配和回收过程,以及不同垃圾回收器的工作原理和参数设置。
80 4
JVM知识体系学习六:JVM垃圾是什么、GC常用垃圾清除算法、堆内存逻辑分区、栈上分配、对象何时进入老年代、有关老年代新生代的两个问题、常见的垃圾回收器、CMS
|
2月前
|
Java
JVM进阶调优系列(5)CMS回收器通俗演义一文讲透FullGC
本文介绍了JVM中CMS垃圾回收器对Full GC的优化,包括Stop the world的影响、Full GC触发条件、GC过程的四个阶段(初始标记、并发标记、重新标记、并发清理)及并发清理期间的Concurrent mode failure处理,并简述了GC roots的概念及其在GC中的作用。
|
5月前
|
存储 算法 安全
(八)JVM成神路之GC分区篇:G1、ZGC、ShenandoahGC高性能收集器深入剖析
在《GC分代篇》中,我们曾对JVM中的分代GC收集器进行了全面阐述,而在本章中重点则是对JDK后续新版本中研发推出的高性能收集器进行深入剖析。
197 12
|
5月前
|
算法 安全 Java
(七)JVM成神路之GC分代篇:分代GC器、CMS收集器及YoungGC、FullGC日志剖析
在《GC基础篇》中曾谈到过分代以及分区回收的概念,但基础篇更多的是建立在GC的一些算法理论上进行高谈阔论,而本篇则重点会对于分代收集器的实现进行全面详解,其中会涵盖串行收集器、并行收集器、三色标记、SATB算法、GC执行过程、并发标记、CMS收集器等知识,本篇则偏重于分析GC机制的落地实现,也就是垃圾收集器(Garbage Collector)。
133 8
|
4月前
|
监控 JavaScript Java
JVM源码级别分析G1发生FullGC元凶的是什么
线上系统遭遇频繁Old GC问题,监控显示出现多次“to-space exhausted”日志,这表明垃圾回收过程中因年轻代 Survivor 区或老年代空间不足导致对象晋升失败。通过 JVM 源码分析,此问题源于对象转移至老年代失败时,JVM 无法找到足够的空间存放存活对象。进一步排查发现大对象分配占用了预留空间,加剧了空间不足的情况。使用 JFR 分析工具定位到定期报表序列化导致大量大对象生成,通过改用堆外内存进行序列化输出,最终解决了频繁 Old GC 问题。
146 0
|
6月前
|
存储 缓存 监控
JVM中G1垃圾收集器:原理、过程和参数配置深入解析
JVM中G1垃圾收集器:原理、过程和参数配置深入解析
|
7月前
|
存储 算法 Java
深入浅出JVM(十八)之并发垃圾收集器G1
深入浅出JVM(十八)之并发垃圾收集器G1
|
28天前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
231 1