1、前言
《JVM学习.01 内存模型》篇讲述了JVM的内存布局,其中每个区域是作用,以及创建实例对象的时候内存区域的工作流程。上文还讲到了关于对象存货后,会被回收清理的过程。今天这里就着重讲一下对象实例是如何被清理回收的,以及清理回收的几种算法。
2、再谈引用
JDK1.2版本之后,对引用的概念进行了扩充,分为强引用,软引用,弱引用,虚引用。这4种引用关系强度依次减弱。
2.1、Strongly Reference 强引用
强应用是最传统的”引用“定义。这种引用关系,无论任何情况(包括OOM异常),只要强引用关系还存在,GC就不会回收掉被引用对象。
声明方式:
Object object = new Object();
2.2、Soft Reference 软引用
一种相对强引用弱化了一些的引用。比如高速缓存就可以用到软引用。当内存足够时就保留,不够时就回收。其中:
- 当系统内存充足的时候,不会被回收;
- 当系统内存不足的时,会将这些对象列进回收范围之中进行第二次回收,如果还是内存不足,才会抛出内存溢出异常。
声明方式:
SoftReference softReference = new SoftReference<>(obj);
2.3、Weak Reference 弱引用
弱引用的强度比软引用更弱一些。被弱引用关联的对象,生命周期只能到下一次GC。当GC开始工作,无论当前的内存是否够用,都会会受到被弱引用关联的对象。
声明方式:
WeakReference weakReference = new WeakReference<>(obj);
2.4、Phantom Reference 虚引用
虚引用是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对该对象的生存时间构成影响,也无法通过虚引用来取得一个对象实例。虚引用的作用主要是用来跟踪对象被垃圾回收的状态。
设值虚引用关联的唯一目的,就是在这个对象被回收的时候收到一个系统通知,或是后续添加进一步的操作处理。
声明方式:
PhantomReference phantomReference = new PhantomReference<>(obj, rq);
2.5、各引用小结
- 强引用:对象不会被回收,出现OOM
- 软引用:内存不够时才回收(二次清理)
- 弱引用:只要GC就回收
- 虚引用:用于检测对象的GC状态
3、如何判断对象“存活”
3.1、引用计数算法
在JVM中专门开辟一块额外的内存空间,专门用来对实例引用进行技数。一个对象如果在JVM中有被别人引用(关联或持有),则计数器+1;反之,则-1。任何时刻只要计数器为0的对象(没有任何指针对其引用),那么他就是不是存活,需要被清理。
这种的技数方式虽然原理简单,效率也很高,且有不错的案例使用。但是依然存在弊端。
看一段代码:
public class GcReferenceCount { public void testGC(){ GcObject gcObj1 = new GcObject(); GcObject gcObj2 = new GcObject(); gcObj1.gcObj = gcObj2; gcObj2.gcObj = gcObj1; gcObj1 = null; gcObj2 = null; // 假设这里发生了gc System.gc(); } } class GcObject { GcObject gcObj; }
上述代码,gcObj1和gcObj2互为引用。就算当gcObj1 = null;gcObj = null;那么计数器永远不可能为0,意味着永远不可能被回收。
3.2、可达性分析算法
通过一系列被称为“GC Roots”的根对象作为起始节点集,从这些节点开始根据引用关系向下搜索,搜索过程所走的路径称为“引用链”。如果某个对象到GC Roots间都没有任何的引用链关联,或者说到GC Roots对象不可达的,则证明此对象是内存垃圾。
通过这种方式可以规避引用计数算法存在的相互指向的问题。也是目前GC中默认的分析标记算法。
网上借来的图:
3.3、并发的可达性分析
这里的并发指的是用户线程和GC线程同时工作。
3.2中提到的可达性分析算法用来断定对象是否存活。理论上要求标记的全过程都基于一个保障一致性的快照中才能进行(假设一边在进行链路搜索,一边用户线程又在更改对象引用指向,那么起初搜索过的路径就会存在歧义)。且往往需要标记的对象又是大多数,这时候随着堆变大而等比例的增加STW(停顿)时间,那么也将直接影响整个系统。
为了解决或降低用户线程的停顿,即要搞为什么必须要在一个能保证一致性的快照中才能进行。引入了”三色标记“算法作为工具来辅助推导。这里将对象按照”是否访问过“分成三种颜色:
- 白色:该对象没有被GC访问过。
- 黑色:该对象被GC访问过,他是安全存活的,且这个对象所有引用都被扫描过。
- 灰色:该对象被GC访问过,但这个对象至少存在一个引用还没被扫描过。
关于并发可达性分析算法,可能存在两个问题:
1、原本消亡的对象被错误标记为存活,这个是可以容忍的。只不过产生了一点浮动垃圾而已,等待下次回收就可以了。
2、原本存活的对象被错误标记为消亡,这个可能会导致系统的致命错误。
关于并发出现”对象消失“问题示意图:
同时满足两个条件时,就会出现”对象消失“的问题:
1、赋值器插入一条或多条从黑色对象到白色对象的新引用;
2、赋值器删除了全部从灰色对象到该白色对象的直接或间接引用;
解决方式:
1、增量更新。破坏第一个条件。当黑色对象插入新的指向白色对象的引用时,把这个新的引用记录下来,等并发标记结束之后,再扫描一次这个记录。比如用一个队列记录下来。可以理解为,黑色对象一旦新插入白色对象的引用之后,它就变回灰色对象了。
2、原始快照。破坏第二个条件。当灰色对象要删除指向白色对象的引用时,就把这个要删除的引用记录下来,等并发标记结束之后,再以这个记录里的灰色对象为根,重新扫描一次。
4、内存回收策略
4.1、标记 - 清除算法
标记:标记处所有需要回收的对象(也可以反过来,标记存活的对象)。
清除:在标记完成后,统一回收所有被标记的对象(如果标记的是需要被回收的对象的话,否则反之)。
网上借的图:
主要缺点:
1、执行效率不稳定。如果Java堆中包含大量对象,且其中大部分是需要被回收的。必须进行大量的标记动作,导致执行效率会随着对象数量增加而降低;
2、空间碎片化。标记,清除后会产生大量不连续的内存碎片。空间碎片太多会导致后面大对象分配时无法找到足够的连续空间。
4.2、标记 - 复制算法
将内存分为大小相等的两块空间,每次只使用其中一块。
标记:标记处所有需要回收的对象(也可以反过来,标记存活的对象)。
复制:当其中一块的内存不足时,将存活的对象复制到另一块内存中。然后把这块的对象清理。
网上借的图:
主要缺点:
1、空间利用率低。以空间换时间的做法,造成空间浪费;其间始终有一块内存没有被使用。
2、效率问题。如果对象有大量都是存活的,那么复制的对象很多,效率自然也会低下。
主要优点:
适合大量对象都是短生命周期的。一次性收集后存活对象很少的情况。同时也避免了空间碎片的问题。
4.3、标记 - 整理算法
结合了标记清除和标记复制的优缺点。
标记:标记处所有需要回收的对象(也可以反过来,标记存活的对象)。
整理:当被标记对象需要被清理时,对存活的对象不进行复制,而是统一向一端移动,然后清理掉端边界外部的内存空间。
网上借的图:
主要缺点:
1、效率问题。每次存活对象的移动,都带来大量的内存重新寻址的计算量, 执行效率较低。甚至低于复制算法。
主要优点:
不会造成空间碎片和空间浪费问题。
4.4、分代收集原则
到目前为止,大多数的回收器都遵循分代垃圾收集原则。
新生代:以标记复制算法居多。大部分对象生命周期较短,采用复制算法可以避免一定的空间碎片问题,且效率比较高
老年代:标记清除或标记整理算法。因为对象的存活时间比较长。
5、小结
到这里,讲述了JVM中的内存回收,以及引用如何被垃圾收集器回收的一些算法。对JVM的内存使用更加了解。其实JVM相关内容看过很多次,但是从来没有过系统性的整理,大部分都停留在脑子中。第一次尝试整理这些内容,一方面可以加深自己的印象,另一方面,通过搜索其他的参考资料,可以发现很多以前忽略的地方。或许这个就是写技术博客的魅力吧。虽然千篇一律,但都是自己手敲原创。respect!