一文看懂虚拟机中Java对象的生死判别-阿里云开发者社区

一、概述

在虚拟机中要回收对象（垃圾回收）需要知道三件事：

那些对象需要回收？

什么时候回收？

如何回收？

我们来回忆一下虚拟机的运行时数据区：程序计数器（私有）、虚拟机栈（私有）、本地方法栈（私有）、Java堆（共享）和方法区（共享）

在前面的博客里，我介绍了Java内存运行时区域的各个部分，其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生，随线程而灭，栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的（尽管在运行期会由即时编译器进行一些优化，但在基于概念模型的讨论里，大体上可以认为是编译期可知的），因此这几个区域的内存分配和回收都具备确定性，在这几个区域内就不需要过多考虑如何回收的问题，当方法结束或者线程结束时，内存自然就跟随着回收了。

而Java堆和方法区这两个区域则有着很显著的不确定性：一个接口的多个实现类需要的内存可能会不一样，一个方法所执行的不同条件分支所需要的内存也可能不一样，只有处于运行期间，我们才能知道程序究竟会创建哪些对象，创建多少个对象，这部分内存的分配和回收是动态的。

垃圾收集器所关注的正是这部分内存该如何管理，下面的内容我们指的也是这部分内存。

既然虚拟机的对象回收主要是针对Java堆和方法区，那么对象回收判断的依据是什么？具体的判断实现逻辑又是什么？

依据：是否有引用指向该对象

具体实现：引用计数法、可达性分析法

二、引用计数法

引用计数法（Reference Counting）的逻辑较为简单，就是在对象中添加一个引用计数器，每当有一个地方引用它时，计数器值就加一；当引用失效时，计数器值就减一；任何时刻计数器为零的对象就是不可能再被使用的。

对于引用计数法来说虽然占用了一些额外的内存空间来进行计数，但它的原理简单，判定效率也很高，在大多数情况下它都是一个不错的算法。也有一些比较著名的应用案例，例如微软COM（Component Object Model）技术、使用ActionScript 3的FlashPlayer、Python语言以及在游戏脚本领域得到许多应用的Squirrel中都使用了引用计数算法进行内存管理。

但是，在Java中，至少主流的Java虚拟机里面都没有选用引用计数算法来管理内存，主要原因是，这个看似简单的算法有很多例外情况要考虑，必须要配合大量额外处理才能保证正确地工作，譬如单纯的引用计数就很难解决对象之间相互循环引用的问题。

优点：

原理简单

判定效率很高

缺点：

占用一些额外的内存空间来进行计数

难解决对象之间相互循环引用的问题

举个简单的例子，请看下面代码main方法：对象objectA和objectB都有字段instance，赋值令objectA.instance=objectB及objectB.instance=objectA，除此之外，这两个对象再无任何引用，实际上这两个对象已经不可能再被访问，但是它们因为互相引用着对方，导致它们的引用计数都不为零，引用计数算法也就无法回收它们。

public class RefCountGC{
    private byte[] bigSize = new byte[2 * 1024 * 1024];//这个成员属性唯一的作用就是占用一点内存
    Object instance = null;
    public static void main(String[] args){
        RefCountGC objectA = new RefCountGC();
        RefCountGC objectB = new RefCountGC();
        objectA.instance = objectB;
        objectB.instance = objectA;
        objectA = null;
        objectB = null;
        System.gc();
    }
}

三、可达性分析法

Java判定对象是否可回收的算法就是可达性分析法。

这个算法的基本思路就是通过一系列称为“GC Roots”的根对象作为起始节点集，从这些节点开始，根据引用关系向下搜索，搜索过程所走过的路径为“引用链”（Reference Chain），如果某个对象到GC Roots间没有任何引用链相连，或者用图论的话来说就是从GC Roots到这个对象不可达时，则证明此对象是不可能再被使用的。

对象obj4，obj5虽然互有关联，但是它们到GC Roots是不可达的，因此它们将会被判定为可回收的对象。

什么是GCRoots？

所谓“GC roots”，或者说tracing GC的“根集合”，就是一组必须活跃的引用。

那么什么对象引用可以作为GCRoot的对象？

在虚拟机栈（栈帧中的本地变量表）中引用的对象，譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。

在方法区中类静态属性引用的对象，譬如Java类的引用类型静态变量。

在方法区中常量引用的对象，譬如字符串常量池（String Table）里的引用。

在本地方法栈中JNI（即通常所说的Native方法）引用的对象。

Java虚拟机内部的引用，如基本数据类型对应的Class对象，一些常驻的异常对象（比如NullPointExcepiton、OutOfMemoryError）等，还有系统类加载器。

所有被同步锁（synchronized关键字）持有的对象。

反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

当然除了上面这些固定的GC Roots集合以外，根据用户所选用的垃圾收集器以及当前回收的内存区域不同，还可以有其他对象“临时性”地加入，共同构成完整GC Roots集合。

例如分代收集和局部回收（Partial GC），如果只针对Java堆中某一块区域发起垃圾收集时（如最典型的只针对新生代的垃圾收集），必须考虑到内存区域是虚拟机自己的实现细节（在用户视角里任何内存区域都是不可见的），更不是孤立封闭的，所以某个区域里的对象完全有可能被位于堆中其他区域的对象所引用，这时候就需要将这些关联区域的对象也一并加入GC Roots集合中去，才能保证可达性分析的正确性。

目前最新的几款垃圾收集器无一例外都具备了局部回收的特征，为了避免GC Roots包含过多对象而过度膨胀，它们在实现上也做出了各种优化处理（如根节点枚举）。关于这些概念、优化技巧以及各种不同收集器实现等内容，将会在我的后面博客中讲解到。

四、四种引用

从上面我们可以知道无论是通过引用计数算法判断对象的引用数量，还是通过可达性分析算法判断对象是否引用链可达，判定对象是否存活都和“引用”离不开关系。

那么引用是什么？

在JDK 1.2版之前，Java里面的引用是很传统的定义：

如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址，就称该reference数据是代表某块内存、某个对象的引用。

这种定义并没有什么不对，只是现在看来有些过于狭隘了，一个对象在这种定义下只有“被引用”或者“未被引用”两种状态，对于描述一些“食之无味，弃之可惜”的对象就显得无能为力。譬如我们希望能描述一类对象：当内存空间还足够时，能保留在内存之中，如果内存空间在进行垃圾收集后仍然非常紧张，那就可以抛弃这些对象——很多系统的缓存功能都符合这样的应用场景。

在JDK 1.2版之后，Java对引用的概念进行了扩充，将引用分为强引用（Strongly Re-ference）、软引用（Soft Reference）、弱引用（Weak Reference）和虚引用（Phantom Reference）4种，这4种引用强度依次逐渐减弱。

4.1 强引用

开发中用的最多的就是强引用了。

强引用声明格式：

Object obj=new Object();

只要某个对象与强引用关联，那么JVM在内存不足的情况下，宁愿抛出outOfMemoryError错误，也不会回收此类对象。

如果我们想要JVM回收此类被强引用关联的对象，我们可以显示地将str置为null，那么JVM就会在合适的时间回收此对象。

4.2 软引用

软引用是用来描述一些还有用，但非必须的对象。

如果某个 Java 对象只被软引用所指向，那么在 JVM 要新建一个对象的时候，如果当前虚拟机所剩下的堆内存不足以保存这个要新建的对象的时候（即虚拟机将要抛出 OutOfMemoryError 异常的时候），那么 JVM 会发起一次垃圾回收（gc）动作，将堆中所只被非强引用指向的对象回收，以提供更多的可用内存来新建这个对象，如果经过垃圾回收动作之后虚拟机的堆内存中仍然没有足够的可用空间来创建这个对象，那么虚拟机将抛出一个 OutOfMemoryError 异常

在JDK 1.2版之后提供了SoftReference类来实现软引用。

import java.lang.ref.SoftReference;
public class TestRef {
    public static void main(String args[]) {
        SoftReference<String> str = new SoftReference<String>(new String("abc"));
        System.out.println(str.get());
        //通知JVM进行内存回收
        System.gc();
        System.out.println(str.get());
    }
}

软引用适合做缓存，在内存足够时，直接通过软引用取值，无需从真实来源中查询数据，可以显著地提升网站性能。当内存不足时，能让JVM进行内存回收，从而删除缓存，这时候只能从真实来源查询数据。

4.3 弱引用

弱引用也是用来描述那些非必须对象，但是它的强度比软引用更弱一些，被弱引用关联的对象只能生存到下一次垃圾收集发生为止。

当垃圾收集器开始工作，无论当前内存是否足够，都会回收掉只被弱引用关联的对象。

在JDK 1.2版之后提供了WeakReference类来实现弱引用。

import java.lang.ref.WeakReference;
public class TestRef {
    public static void main(String args[]) {
        WeakReference<String> str = new WeakReference<String>(new String("abc"));
        System.out.println(str.get());
        //通知JVM进行内存回收
        System.gc();
        System.out.println(str.get());
    }
}

弱引用可以在回调函数在防止内存泄露。因为回调函数往往是匿名内部类，一个非静态的内部类会隐式地持有外部类的一个强引用，当JVM在回收外部类的时候，此时回调函数在某个线程里面被回调的时候，JVM就无法回收外部类，造成内存泄漏。在安卓activity内声明一个非静态的内部类时，如果考虑防止内存泄露的话，应当显示地声明此内部类持有外部类的一个弱引用。

4.4 虚引用

虚引用也称为“幽灵引用”或者“幻影引用”，它是最弱的一种引用关系。

这种引用有点特殊：被虚引用完全不会影响其所指向的对象的生命周期，也就是说一个 Java 对象是否被回收和指向它的虚引用完全没有任何关系。也不能通过虚引用来得到其指向的对象（其 get 方法直接返回 null）。

那么虚引用有什么作用呢？

虚引用一般会配合引用队列（ReferenceQueue）来使用。当某个被虚引用指向的对象被回收时，我们可以在其引用队列中得到这个虚引用的对象作为其所指向的对象被回收的一个通知。我们将会在后面看到这种用法。

在JDK 1.2版之后提供了PhantomReference类来实现虚引用，但虚引用不能单独使用，必须配合引用队列一起使用。

import java.lang.ref.PhantomReference;
import java.lang.ref.ReferenceQueue;
public class TestRef {
    public static void main(String args[]) {
        ReferenceQueue<String> queue = new ReferenceQueue<>();
        PhantomReference<String> str = new PhantomReference<String>("abc", queue);
        System.out.println(str.get()); // 输出null
    }
}

五、生存或是死亡

上面提到过判定对象的死亡用的是可达性分析法，然而即使在可达性分析算法中判定为不可达的对象，也不是“非死不可”的，这时候它们暂时还处于“缓刑”阶段，要真正宣告一个对象死亡，至少要经历两次标记过程：如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链，那它将会被第一次标记，随后进行一次筛选，筛选的条件是此对象是否有必要执行finalize()方法。

假如对象没有覆盖finalize()方法，或者finalize()方法已经被虚拟机调用过，那么虚拟机将这两种情况都视为“没有必要执行”。

如果这个对象被判定为确有必要执行finalize()方法，那么该对象将会被放置在一个名为F-Queue的队列之中，并在稍后由一条由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize()方法。

这里所说的“执行”是指虚拟机会触发这个方法开始运行，但并不承诺一定会等待它运行结束。这样做的原因是，如果某个对象的finalize()方法执行缓慢，或者更极端地发生了死循环，将很可能导致F-Queue队列中的其他对象永久处于等待，甚至导致整个内存回收子系统的崩溃。

finalize()方法是对象逃脱死亡命运的最后一次机会，稍后收集器将对F-Queue中的对象进行第二次小规模的标记，如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可，譬如把自己（this关键字）赋值给某个类变量或者对象的成员变量，那在第二次标记时它将被移出“即将回收”的集合；如果对象这时候还没有逃脱，那基本上它就真的要被回收了。

从下面代码我们可以看到一个对象的finalize()被执行，但是它仍然可以存活。

/**
* 此代码演示了两点： 
* 1.对象可以在被GC时自我拯救。 
* 2.这种自救的机会只有一次，因为一个对象的finalize()方法最多只会被系统自动调用一次 
*/
public class FinalizeEscapeGC { 
    public static FinalizeEscapeGC SAVE_HOOK = null; 
    public void isAlive() { 
        System.out.println("yes, i am still alive :)"); 
    }
    @Override 
    protected void finalize() throws Throwable { 
        super.finalize(); 
        System.out.println("finalize method executed!"); 
        FinalizeEscapeGC.SAVE_HOOK = this; 
    }
    public static void main(String[] args) throws Throwable { 
        SAVE_HOOK = new FinalizeEscapeGC(); 
        //对象第一次成功拯救自己
        SAVE_HOOK = null; System.gc(); 
        // 因为Finalizer方法优先级很低，暂停0.5秒，以等待它 
        Thread.sleep(500); 
        if (SAVE_HOOK != null) { 
            SAVE_HOOK.isAlive(); 
        } else {
            System.out.println("no, i am dead :("); 
        }
        // 下面这段代码与上面的完全相同，但是这次自救却失败了
        SAVE_HOOK = null; System.gc(); 
        // 因为Finalizer方法优先级很低，暂停0.5秒，以等待它 
        Thread.sleep(500); 
        if (SAVE_HOOK != null) { 
            SAVE_HOOK.isAlive(); 
        } else { 
            System.out.println("no, i am dead :("); 
        } 
    }
}

运行结果

finalize method executed! 
yes, i am still alive :) 
no, i am dead :(

从代码的运行结果可以看到，SAVE_HOOK对象的finalize()方法确实被垃圾收集器触发过，并且在被收集前成功逃脱了。

另外一个值得注意的地方就是，代码中有两段完全一样的代码片段，执行结果却是一次逃脱成功，一次失败了。这是因为任何一个对象的finalize()方法都只会被系统自动调用一次，如果对象面临下一次回收，它的finalize()方法不会被再次执行，因此第二段代码的自救行动失败了。

需要特别说明，上面关于对象死亡时finalize()方法的描述可能带点悲情的艺术加工，笔者并不鼓励大家使用这个方法来拯救对象。相反，笔者建议大家尽量避免使用它，因为它并不能等同于C和C++语言中的析构函数，而是Java刚诞生时为了使传统C、C++程序员更容易接受Java所做出的一项妥协。它的运行代价高昂，不确定性大，无法保证各个对象的调用顺序，如今已被官方明确声明为不推荐使用的语法。有些教材中描述它适合做“关闭外部资源”之类的清理性工作，这完全是对finalize() 方法用途的一种自我安慰。finalize()能做的所有工作，使用try-finally或者其他方式都可以做得更好、更及时，所以建议大家完全可以忘掉Java语言里面的这个方法。

六、方法区回收

看过我前面得博客就知道，方法区是内存共享的，而且有些人认为方法区（如HotSpot虚拟机中的元空间或者永久代）是没有垃圾收集行为的。

《Java虚拟机规范》中提到过可以不要求虚拟机在方法区中实现垃圾收集

为什么会如此？

方法区垃圾收集得性价比低
方法区垃圾回收条件苛刻
方法区的垃圾收集主要回收两部分内容：废弃的常量和不再使用的类型。

废弃得常量

回收废弃常量与回收Java堆中的对象非常类似。

举个常量池中字面量回收的例子，假如一个字符串“java”曾经进入常量池中，但是当前系统又没有任何一个字符串对象的值是“java”，换句话说，已经没有任何字符串对象引用常量池中的“java”常量，且虚拟机中也没有其他地方引用这个字面量。如果在这时发生内存回收，而且垃圾收集器判断确有必要的话，这个“java”常量就将会被系统清理出常量池。常量池中其他类（接口）、方法、字段的符号引用也与此类似。

不再使用的类型

判定一个常量是否“废弃”还是相对简单，而要判定一个类型是否属于“不再被使用的类”的条件就比较苛刻了。需要同时满足下面三个条件：

该类所有的实例都已经被回收，也就是Java堆中不存在该类的任何实例。

加载类的ClassLoader已经被回收。（通常是很难达成，件除非是经过精心设计的可替换类加载器的场景，如OSGi、JSP的重加载等）

该类对应的java.lang.Class对象没有在任何地方被引用，无法在任何地方通过发射访问该类的方法。

Java虚拟机被允许对满足上述三个条件的无用类进行回收，这里说的仅仅是“被允许”，而并不是和对象一样，没有引用了就必然会回收。

关于是否要对类型进行回收，HotSpot虚拟机提供了-Xnoclassgc参数进行控制

在大量使用反射、动态代理、CGLib等字节码框架，动态生成JSP以及OSGi这类频繁自定义类加载器的场景中，通常都需要Java虚拟机具备类型卸载的能力，以保证不会对方法区造成过大的内存压力

到此本文的内容就讲解完毕了，我们主要概括一下：

确定一个对象是垃圾方法有两种，引用计数法（主流虚拟机不再使用）、可达性分析法（主流虚拟机在使用）
扩展对象的四种引用（引用关联着对象是否是垃圾）
接着介绍了对象如何逃避死亡被回收的命运（重写finalize方法）
最后讨论了一下方法区垃圾回收（有垃圾回收，但条件苛刻）

既然知道了哪些是垃圾对象，那么下期就是介绍具体的垃圾回收方法了（先讲垃圾回收算法，后将算法实现）

我们下期见！

结束语

由于博主才疏学浅，难免会有纰漏，假如你发现了错误或偏见的地方，还望留言给我指出来，我会对其加以修正。
如果你觉得文章还不错，你的转发、分享、点赞、留言就是对我最大的鼓励。
感谢您的阅读，十分欢迎并感谢您的关注。

一文看懂虚拟机中Java对象的生死判别

一、概述

二、引用计数法

三、可达性分析法

四、四种引用

4.1 强引用

4.2 软引用

4.3 弱引用

五、生存或是死亡

六、方法区回收

结束语

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

一文看懂虚拟机中Java对象的生死判别

一、概述

二、引用计数法

三、可达性分析法

四、四种引用

4.1 强引用

4.2 软引用

4.3 弱引用

五、生存或是死亡

六、方法区回收

结束语

热门文章

最新文章

相关课程

相关电子书

相关实验场景