Java虚拟机详解05----垃圾收集器及GC参数

简介:

本文主要内容:

  • 堆的回顾
  • 串行收集器
  • 并行收集器
  • CMS收集器

 

零、堆的回顾:

新生代中的98%对象都是“朝生夕死”的,所以并不需要按照1:1的比例来划分内存空间,而是内存分为一块比较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8:1,也就是说,每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的空间会被浪费。

当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于10%的对象存活,当Survivor空间不够用时,需要依赖于老年代进行分配担保,所以大对象直接进入老年代。

堆的结构如下图所示:

93ae46da-b4f7-4c3b-851a-97dfb4d68da4

垃圾收集器:

如果说收集算法时内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。

虽然我们在对各种收集器进行比较,但并非为了挑出一个最好的收集器。因为直到现在位置还没有最好的收集器出现,更加没有万能的收集器,所以我们选择的只是对具体应用最合适的收集器

 

一、串行收集器:Serial收集器

  • 最古老,最稳定
  • 简单而高效
  • 可能会产生较长的停顿
  • -XX:+UseSerialGC

    新生代、老年代都会使用串行回收

      新生代复制算法

    老年代标记-整理

总结:Serial收集器对于运行在Client模式下的虚拟机来说是一个很好的选择。

这个收集器是一个单线程的收集器,但它的单线程的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。收集器的运行过程如下图所示:

28d89f4c-be3f-4e47-90c5-6bac8399a968

 

二、并行收集器:

1、ParNew收集器:

  • ParNew收集器其实就是Serial收集器新生代的并行版本。
  • 多线程,需要多核支持。
  • -XX:+UseParNewGC

    新生代并行

    老年代串行

  • -XX:ParallelGCThreads 限制线程数量

fa772027-b69f-426e-bb6b-901a0982ace5

2、Parallel Scanvenge收集器:

  • 类似ParNew,但更加关注吞吐量
  • -XX:+UseParallelGC  使用Parallel Scanvenge收集器:新生代并行,老年代串行

3、Parallel Old收集器:

  • Parallel Old收集器是Parallel Scanvenge收集器的老年代版本
  • -XX:+UseParallelGC  使用Parallel Old收集器:新生代并行,老年代并行

如下图所示:

a1c893fd-461d-42f6-9a90-a8dc43a89526

各种参数设置:

  • -XX:MaxGCPauseMills

    最大停顿时间,单位毫秒

    GC尽力保证回收时间不超过设定值

  • -XX:GCTimeRatio

    0-100的取值范围

    垃圾收集时间占总时间的比

    默认99,即最大允许1%时间做GC

注:这两个参数是矛盾的。因为停顿时间和吞吐量不可能同时调优。我们一方买希望停顿时间少,另外一方面希望吞吐量高,其实这是矛盾的。因为:在GC的时候,垃圾回收的工作总量是不变的,如果将停顿时间减少,那频率就会提高;既然频率提高了,说明就会频繁的进行GC,那吞吐量就会减少,性能就会降低。

吞吐量:CPU用于用户代码的时间/CPU总消耗时间的比值,即=运行用户代码的时间/(运行用户代码时间+垃圾收集时间)。比如,虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,那吞吐量就是99%。

注2:以上所有的收集器当中,当执行GC时,都会stop the world,但是下面的CMS收集器却不会这样。

 

三、CMS收集器:

CMS收集器(Concurrent Mark Sweep:并发标记清除)是一种以获取最短回收停顿时间为目标的收集器。适合应用在互联网站或者B/S系统的服务器上,这类应用尤其重视服务器的响应速度,希望系统停顿时间最短。

  • Concurrent Mark Sweep 并发标记清除,并发低停顿
  • 标记-清除算法
  • 并发阶段会降低吞吐量(因为停顿时间减少了,于是GC的频率会变高)
  • 老年代收集器(新生代使用ParNew)
  • -XX:+UseConcMarkSweepGC   打开这收集器

注:这里的并发指的是与用户线程一起执行。

 

2、CMS收集器运行过程:(着重实现了标记的过程)

(1)初始标记

根可以直接关联到的对象

速度快

(2)并发标记(和用户线程一起)

主要标记过程,标记全部对象

(3)重新标记

由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正

(4)并发清除(和用户线程一起)

基于标记结果,直接清理对象

整个过程如下图所示:

8ba55616-9537-4a84-87eb-5c45afcc4939

其中,初始标记和重新标记时,需要stop the world。

整个过程中耗时最长的是并发标记和并发清除,这两个过程都可以和用户线程一起工作。

打印GC日志举例如下:

453861ce-5fd8-4d87-b6e3-6799a589e69b

3、CMS收集器特点:

(1)尽可能降低停顿

(2)会影响系统整体吞吐量和性能

比如,在用户线程运行过程中,分一半CPU去做GC,系统性能在GC阶段,反应速度就下降一半

(3)清理不彻底

因为在清理阶段,用户线程还在运行,会产生新的垃圾,无法清理

(4)因为和用户线程一起运行,不能在空间快满时再清理

-XX:CMSInitiatingOccupancyFraction设置触发GC的阈值

如果不幸内存预留空间不够,就会引起concurrent mode failure

我们来看一下concurrent mode failure的日志:

ae662550-f927-4299-a64b-2b1fba3e4c81

碰到上图中的情况,我们需要使用串行收集器作为后备。

 

4、既然标记清除算法会造成内存空间的碎片化,CMS收集器为什么使用标记清除算法而不是使用标记整理算法:

答案:

    CMS收集器更加关注停顿,它在做GC的时候是和用户线程一起工作的(并发执行),如果使用标记整理算法的话,那么在清理的时候就会去移动可用对象的内存空间,那么应用程序的线程就很有可能找不到应用对象在哪里。

为了解决碎片的问题,CMS收集器会有一些整理上的参数,接下来就来讲这个。

 

5、整理时的各种参数:

  • -XX:+ UseCMSCompactAtFullCollection     

Full GC后,进行一次整理。整理过程是独占的,会引起停顿时间变长

  • -XX:+CMSFullGCsBeforeCompaction

设置进行几次Full GC后,进行一次碎片整理

  • -XX:ParallelCMSThreads

设定CMS的线程数量

 

四、GC参数的整理:

-XX:+UseSerialGC:在新生代和老年代使用串行收集器

-XX:SurvivorRatio:设置eden区大小和survivior区大小的比例

-XX:NewRatio:新生代和老年代的比

-XX:+UseParNewGC:在新生代使用并行收集器

-XX:+UseParallelGC :新生代使用并行回收收集器

-XX:+UseParallelOldGC:老年代使用并行回收收集器

-XX:ParallelGCThreads:设置用于垃圾回收的线程数

-XX:+UseConcMarkSweepGC:新生代使用并行收集器,老年代使用CMS+串行收集器

-XX:ParallelCMSThreads:设定CMS的线程数量

-XX:CMSInitiatingOccupancyFraction:设置CMS收集器在老年代空间被使用多少后触发

-XX:+UseCMSCompactAtFullCollection:设置CMS收集器在完成垃圾收集后是否要进行一次内存碎片的整理

-XX:CMSFullGCsBeforeCompaction:设定进行多少次CMS垃圾回收后,进行一次内存压缩

-XX:+CMSClassUnloadingEnabled:允许对类元数据进行回收

-XX:CMSInitiatingPermOccupancyFraction:当永久区占用率达到这一百分比时,启动CMS回收

-XX:UseCMSInitiatingOccupancyOnly:表示只在到达阀值的时候,才进行CMS回收

 

最后的总结:

为了减轻GC压力,我们需要注意些什么?

  • 软件如何设计架构(性能的根本在应用)
  • GC参数属于微调(设置不合理会影响性能,产生大的延时)
  • 堆空间如何管理和分配
  • 代码如何写

 

相关文章
|
1月前
|
DataWorks Java 关系型数据库
DataWorks常见问题之将预警信息发送至邮箱
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
35 1
|
1月前
|
存储 Java 数据安全/隐私保护
【JVM】Java虚拟机栈(Java Virtual Machine Stacks)
【JVM】Java虚拟机栈(Java Virtual Machine Stacks)
35 0
|
21天前
|
缓存 Java C#
【JVM故障问题排查心得】「Java技术体系方向」Java虚拟机内存优化之虚拟机参数调优原理介绍(一)
【JVM故障问题排查心得】「Java技术体系方向」Java虚拟机内存优化之虚拟机参数调优原理介绍
60 0
|
11天前
|
算法 Java UED
【五一创作】值得一看的JVM垃圾收集器
【五一创作】值得一看的JVM垃圾收集器
|
1月前
|
监控 Java
JVM常用的命令行参数
JVM常用的命令行参数
|
1月前
|
存储 Java 开发者
深入理解Java虚拟机(JVM)内存管理
【2月更文挑战第11天】 在本篇文章中,我们将深入探讨Java虚拟机(JVM)的内存管理机制,一项对于优化Java应用性能至关重要的技术领域。不同于常规的技术文章摘要,我们不仅概述了JVM内存管理的基本概念,还将引导读者通过实际案例理解其在现实世界应用中的重要性。从堆(Heap)和栈(Stack)的区别开始,到垃圾收集(Garbage Collection)机制的工作原理,本文旨在为Java开发者提供一个清晰、系统的JVM内存管理知识框架,帮助他们在开发过程中做出更加明智的决策。
|
2月前
|
存储 算法 Java
Java虚拟机内存管理机制
【2月更文挑战第7天】本文主要介绍了Java虚拟机内存管理机制的基本原理和实现方式。Java虚拟机的内存管理机制是Java程序运行的重要组成部分,对程序性能和稳定性有着直接的影响。文章首先从Java虚拟机内存模型入手,介绍了Java虚拟机中堆内存、方法区、栈、PC寄存器等内存区域的功能特点和使用方式;然后详细阐述了Java虚拟机内存管理机制的垃圾回收算法和回收器的分类、优化和实现过程;最后介绍了一些常见的内存问题和优化技巧,以及如何通过代码调优和合理使用内存配置参数来提高程序的性能和稳定性。
|
2月前
|
NoSQL Java Redis
【Java专题_09】生产环境Jvm参数设置
【Java专题_09】生产环境Jvm参数设置
|
3月前
|
Java Unix Linux
【JVM】JVM 调优参数
【1月更文挑战第27天】【JVM】JVM 调优参数
|
3月前
|
安全 前端开发 Java
【JVM】<Java虚拟机>JVM架构&各种**虚拟机
【1月更文挑战第26天】【JVM】<Java虚拟机>JVM架构&各种**虚拟机