直击面试,聊聊 GC 机制

简介: GC 中文直译垃圾回收,是一种回收内存空间避免内存泄漏的机制。当 JVM 内存紧张,通过执行 GC 有效回收内存,转而分配给新对象从而实现内存的再利用。JVM 的 GC 机制虽然无需开发主动参与,减轻不少工作量,但是某些情况下,自动 GC 将会导致系统性能下降,响应变慢,所以这就需要我们提前了解掌握 GC 机制。当面对这种情况时,才能从容不迫的解决问题。另外 GC 机制也是 Java 面试高频考题,了解掌握 GC 是一项必备技能。

1 前言

GC 中文直译垃圾回收,是一种回收内存空间避免内存泄漏的机制。当 JVM 内存紧张,通过执行 GC 有效回收内存,转而分配给新对象从而实现内存的再利用。JVMGC 机制虽然无需开发主动参与,减轻不少工作量,但是某些情况下,自动 GC 将会导致系统性能下降,响应变慢,所以这就需要我们提前了解掌握 GC 机制。当面对这种情况时,才能从容不迫的解决问题。另外 GC 机制也是 Java 面试高频考题,了解掌握 GC 是一项必备技能。

学习 GC ,首先我们解决三个问题:

  • 什么是垃圾
  • 在哪里回收垃圾
  • 怎么回收垃圾

2 什么是垃圾

我们先来看一段简单的代码。67.jpg

上面代码通过将字符串对象转化成字节数组,然后写入本地文件。方法一旦开始执行,就将会在分配一定内存给新建的对象,然后将引用告诉了strbytes 变量。等到方法执行完毕,方法内部局部变量紧接着就会被销毁。但是这样仅仅销毁了局部变量,却没有带走内存上这些实际的对象。这类不再起作用,没有被引用的对象,将其归类为垃圾。

在偌大的内存上存活着无数对象,GC 之前需要准确将这些对象标记出来,分为存活对象与垃圾对象。这个过程一旦少标记,那就只能等待下次 GC标记,再回收,这样将会影响 GC 效率。另外决不能错标记,将正常存活对象标记为垃圾。一旦回收正常存活的对象,可能就会引起程序各种崩溃。

目前有两种算法可以用来标记:

  • 引用计数法
  • 可达性分析法

2.1 引用计数法

引用计数法通过在对象头分配一个字段,用来存储该对象引用计数。一旦该对象被其他对象引用,计数加 1。如果这个引用失效,计数减 1。当引用计数值为 0 时,代表这个对象已不再被引用,可以被回收。68.jpg


如上图所示,当 str 引用堆中对象时,计数值增加为 1。当 str 变为 null 时,既不再引用该对象,计数值减 1。此时该对象就可以被 GC 回收。

引用计数法只需要判断计数值,所以实现比较简单,这个过程也比较高效。但是存在一个很严重的问题,无法解决对象循环引用问题。

69.jpg

从上图可以看到, a,b 不再引用堆中对象,导致计数减一。此时两个对象内部还存在互相引用,计数值不为 0,此时 GC 没办法回收该对象。

2.2 可达性分析法

这个算法首先需要按照规则查找当前活跃的引用,将其称为 GC Roots。接着将 GC Roots 作为根节点出发,遍历对象引用关系图,将可以遍历(可达)的对象标记为存活,其余对象当做无用对象。70.jpg注意这里是是引用,而不是对象。

从上图可以看到,绿色对象虽然存在循环引用,但是由于这些对象不能被 GC Roots 遍历到,所以将会被回收。

可以被当做GC Roots 活跃引用包括但不限于以下引用:

  • 方法中局部变量
  • 静态变量,常量
  • JNI handles
  • ....

3 在哪里回收垃圾

还记得刚开始接触 Java 时,只知道堆栈,对象实例分配在堆中,方法中局部变量位于栈中。实际上 JVM 内存区域划分更加细致,分为:

  • 方法区
  • 虚拟机栈
  • 本地方法栈
  • 程序计数器71.jpg


如图所示,我们将内存划分为线程私有与线程共享的区域。方法区与堆都是线程共享的区域,这两部分占用 JVM 大部分内存,剩下三个小弟将会跟线程绑定,随着线程消亡,自动将会被 JVM 回收。

堆应该是大家最熟悉的一块区域,几乎所有对象实例都将会在此出生,通常也是虚拟机上占用内存最大一块区域,简直就是 JVM 内存中的大哥大。堆内存内部也不是简简单单一块而已,目前将会根据分代算法,将堆分代,不同对象位于不同区域。这一点我们下文再详细了解。

  • 方法区

方法区将会保存已被虚拟上加载的类信息、常量,静态变量,字节码等信息,堆上的对象正式通过方法区这些信息,才能正确创建出来。

虚拟机栈栈由一系列栈帧组成,每个栈帧其实代表一个方法,栈帧中将会保存一个方法的局部变量表,方法出入口信息,操作栈等。每当调用一个方法,就将会把这个栈帧压入栈中,执行结束,出栈。

本地方法栈与虚拟机栈比较类似,最大区别在于,虚拟机栈执行的 Java 方法,而本地方法栈将会用来执行 Native 方法服务。下面方法就会在本地方法栈中执行。

public static native void arraycopy(Object src,  int  srcPos,
                                    Object dest, int destPos,
                                    int length);
  • 程序计数器

程序计算器可以说是这几块区域占用最小的一部分,但是功能却十分重要。Java 源代码通过编译变成字节码,然后被 JVM 载入运行之后,将会变成一条条指令,而程序计数器的工作就是告诉当前线程下一条需要执行指令。这样即使发生了线程切换,等待恢复的时候,当前线程依然知道接下去要执行的指令。

4 怎么回收

目前主流 GC 算法主要分为三种:

  • 标记-清除算法
  • 复制算法
  • 标记-整理算法

4.1 标记-清除算法

这是一个最为基础也是最容易实现的算法,主要实现步骤分为两步:标记,清除。

  • 标记:通过上述 GC Roots 标记出可达对象。
  • 清除:清理未标记对象72.jpg

ps:这个图着实难画啊。。。。

可以看到经过这个算法回收之后,虽然堆空间被清理出来,但是也产生很多空间碎片。这就会导致一个新对象根据堆剩余容量计算,看起来是可以分配,但是实际分配过程,由于没有连续内存,导致虚拟机感知到内存不足,又不得不提前再次触发 GC

可能这里你就会有疑惑,为什么对象需要分配一块连续的内存?

这里引用一下 R 神 @RednaxelaFX 答案。73.jpg

另外这个算法还有一个不足:标记与清除效率比较低。这就竟会导致 GC 占用时间过长,影响正常程序使用。

4.2 复制算法

为了解决上述效率问题,诞生复制算法。这个算法将可用内存分为两块,每次只使用其中一块,当这一块内存使用完毕,触发 GC ,将会把存活的对象依次复制到另外一块上,然后再把已使用过的内存一次性清理。74.jpg

这个算法每次只需要操作一半内存,GC 回收之后也不存在任何空间碎片,新对象内存分配时只需要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。但是这个算法闲置一半内存空间,空间利用效率不高。

PS:复制算法以空间换时间,两者不可兼得

另外对象存活率也会影响复制算法效率。如果对象大部分都是朝生夕死,只需要移动少量存活对象,就能腾出大部分空间。反而如果对象存活率高,这就需要进行较多的复制操作,回收之后也并没有多余内存,这就可能导致频繁触发 GC

针对这种存活时间长的对象,就需要使用标记-整理算法。

4.3 标记-整理算法

标记-整理算法可以说是标记-清除算法的改进版,改进了清除导致的空间碎片问题。这个算法分为两步:

  • 标记:也是通过 GC Roots 标记存活对象。
  • 整理:将存活对象往一端移动,按照内存地址一次排序,然后将末端边界之外内存直接清理。75.jpg

虽然标记-整理算法解决了标记-清除算法空间碎片问题,也完整利用整个内存空间,但是这个算法问题效率并不高。相较于标记-清除算法,标记-整理算法多增加整理这一步,所以该算法效率还低于标记-清除算法。

4.4 分代收集算法

从上面三种 GC 算法可以看到,并没有一种空间与时间效率都是比较完美的算法,所以只能做的是综合利用各种算法特点将其作用到不用的内存区域。

目前商业虚拟机根据对象存活周期不同划分内存区域,一般分为新生代,老年代。新对象一般情况都会优先分配在新生代,新生代对象若存活时间大于一定阈值之后,将会移到至老年代。新生代的对象都是短命鬼,老年代的对象都是长寿先生。

新生代每次 GC 之后都可以回收大批量对象,所以比较适合复制算法,只需要付出少量复制存活对象的成本。这里内存划分并没有按照 1:1 划分,默认将会按照 8:1:1 划分成 Eden 与两块 Survivor空间。每次使用 Eden 与一块Survivor空间,这样我们只是闲置 10% 内存空间。不过我们每次回收并不能保证存活对象小于 10%,在这种情况下就需要依靠老年代的内存分配担保。当Survivor空间并不能保存剩余存活对象,就将这些对象通过分配担保进制移动至老年代。

老年代中对象存活率将会特别高,且没有额外空间进行分配担保,所以并不适合复制算法,所以需要使用标记-清除或标记-整理算法。

5 随便聊聊

最近又到一年一次大考的时候,不得不又拿起周志明『深入 Java 虚拟机』重新学习。还记得第一次翻看这本书的时候,大半内容看不懂,看完也很快就忘了。然后过了一段时间,又重新拿起此书,这次比上次好,也已经能看小大半了。最近跟一些小伙伴聊天,发现他们都是看这本书学习  JVM ,不得不说这本书真是一本神书。最近『深入 Java 虚拟机』第三版即将上架开售,有需要的小伙伴可以考虑入手了。

好了 ,GC 机制就就总结到这里,下一篇我们来聊聊 JVM 常用 GC 回收器。

6 帮助链接

GC Roots

Java虚拟机详解04----GC算法和种类

深入 Java 虚拟机

相关文章
|
1月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
76 2
|
2月前
|
消息中间件 存储 Java
Android面试高频知识点(2) 详解Android消息处理机制(Handler)
Android面试高频知识点(2) 详解Android消息处理机制(Handler)
|
2月前
|
消息中间件 存储 Java
Android面试高频知识点(2) 详解Android消息处理机制(Handler)
Android面试高频知识点(2) 详解Android消息处理机制(Handler)
61 1
|
2月前
|
监控 架构师 Java
从蚂蚁金服面试题窥探STW机制
在Java虚拟机(JVM)中,垃圾回收(GC)是一个至关重要的机制,它负责自动管理内存的分配和释放。然而,垃圾回收过程并非没有代价,其中最为显著的一个影响就是STW(Stop-The-World)机制。STW机制是指在垃圾回收过程中,JVM会暂停所有应用线程的执行,以确保垃圾回收器能够正确地遍历和回收对象。这一机制虽然保证了垃圾回收的安全性和准确性,但也可能对应用程序的性能产生显著影响。
42 2
|
2月前
|
架构师 Java 开发者
得物面试:Springboot自动装配机制是什么?如何控制一个bean 是否加载,使用什么注解?
在40岁老架构师尼恩的读者交流群中,近期多位读者成功获得了知名互联网企业的面试机会,如得物、阿里、滴滴等。然而,面对“Spring Boot自动装配机制”等核心面试题,部分读者因准备不足而未能顺利通过。为此,尼恩团队将系统化梳理和总结这一主题,帮助大家全面提升技术水平,让面试官“爱到不能自已”。
得物面试:Springboot自动装配机制是什么?如何控制一个bean 是否加载,使用什么注解?
|
3月前
|
存储 缓存 Android开发
Android RecyclerView 缓存机制深度解析与面试题
本文首发于公众号“AntDream”,详细解析了 `RecyclerView` 的缓存机制,包括多级缓存的原理与流程,并提供了常见面试题及答案。通过本文,你将深入了解 `RecyclerView` 的高性能秘诀,提升列表和网格的开发技能。
79 8
|
4月前
|
消息中间件 存储 Java
Android面试高频知识点(2) 详解Android消息处理机制(Handler)
Android 消息处理机制估计都被写烂了,但是依然还是要写一下,因为Android应用程序是通过消息来驱动的,Android某种意义上也可以说成是一个以消息驱动的系统,UI、事件、生命周期都和消息处理机制息息相关,并且消息处理机制在整个Android知识体系中也是尤其重要,在太多的源码分析的文章讲得比较繁琐,很多人对整个消息处理机制依然是懵懵懂懂,这篇文章通过一些问答的模式结合Android主线程(UI线程)的工作原理来讲解,源码注释很全,还有结合流程图,如果你对Android 消息处理机制还不是很理解,我相信只要你静下心来耐心的看,肯定会有不少的收获的。
220 3
Android面试高频知识点(2) 详解Android消息处理机制(Handler)
|
4月前
|
Java
【Java基础面试四十七】、 说一说你对Java反射机制的理解
这篇文章介绍了Java反射机制,它允许程序在运行时获取对象和类的真实信息,进行类和实例的创建,以及访问和修改成员变量和方法。
|
5月前
|
监控 算法 Java
Java面试题:如何在Java中触发一次Full GC?请详细解释垃圾回收机制和知识
Java面试题:如何在Java中触发一次Full GC?请详细解释垃圾回收机制和知识
420 4