一文看懂虚拟机中Java对象的生死判别

简介: 一文看懂虚拟机中Java对象的生死判别



在虚拟机中要回收对象(垃圾回收)需要知道三件事:


那些对象需要回收?

什么时候回收?

如何回收?


我们来回忆一下虚拟机的运行时数据区:程序计数器(私有)、虚拟机栈(私有)、本地方法栈(私有)、Java堆(共享)和方法区(共享)


在前面的博客里,我介绍了Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生,随线程而灭,栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的(尽管在运行期会由即时编译器进行一些优化,但在基于概念模 型的讨论里,大体上可以认为是编译期可知的),因此这几个区域的内存分配和回收都具备确定性,在这几个区域内就不需要过多考虑如何回收的问题,当方法结束或者线程结束时,内存自然就跟随着回收了。


而Java堆和方法区这两个区域则有着很显著的不确定性:一个接口的多个实现类需要的内存可能会不一样,一个方法所执行的不同条件分支所需要的内存也可能不一样,只有处于运行期间,我们才能知道程序究竟会创建哪些对象,创建多少个对象,这部分内存的分配和回收是动态的。


垃圾收集器所关注的正是这部分内存该如何管理,下面的内容我们指的也是这部分内存。


既然虚拟机的对象回收主要是针对Java堆和方法区,那么对象回收判断的依据是什么?具体的判断实现逻辑又是什么?


依据:是否有引用指向该对象


具体实现:引用计数法、可达性分析法


二、引用计数法


image.png


引用计数法(Reference Counting)的逻辑较为简单,就是在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。


对于引用计数法来说虽然占用了一些额外的内存空间来进行计数,但它的原理简单,判定效率也很高,在大多数情况下它都是一个不错的算法。也有一些比较著名的应用案例,例如微软COM(Component Object Model)技术、使用ActionScript 3的FlashPlayer、Python语言以及在游戏脚本领域得到许多应用的Squirrel中都使用了引用计数算法进行内存管理。


但是,在Java中,至少主流的Java虚拟机里面都没有选用引用计数算法来管理内存,主要原因是,这个看似简单的算法有很多例外情况要考虑,必须要配合大量额外处理才能保证正确地工作,譬如单纯的引用计数就很难解决对象之间相互循环引用的问题。


优点:

原理简单

判定效率很高


缺点:

占用一些额外的内存空间来进行计数

难解决对象之间相互循环引用的问题


举个简单的例子,请看下面代码main方法:对象objectA和objectB都有字段instance,赋值令objectA.instance=objectB及objectB.instance=objectA,除此之外,这两个对象再无任何引用,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为零,引用计数算法也就无法回收它们。


public class RefCountGC{
    private byte[] bigSize = new byte[2 * 1024 * 1024];//这个成员属性唯一的作用就是占用一点内存
    Object instance = null;
    public static void main(String[] args){
        RefCountGC objectA = new RefCountGC();
        RefCountGC objectB = new RefCountGC();
        objectA.instance = objectB;
        objectB.instance = objectA;
        objectA = null;
        objectB = null;
        System.gc();
    }
}


三、可达性分析法


Java判定对象是否可回收的算法就是可达性分析法。


这个算法的基本思路就是通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过 程所走过的路径为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的。


image.png


对象obj4,obj5虽然互有关联,但是它们到GC Roots是不可达的,因此它们将会被判定为可回收的对象。


什么是GCRoots?


所谓“GC roots”,或者说tracing GC的“根集合”,就是一组必须活跃的引用。


那么什么对象引用可以作为GCRoot的对象?


在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。


在方法区中类静态属性引用的对象,譬如Java类的引用类型静态变量。


在方法区中常量引用的对象,譬如字符串常量池(String Table)里的引用。


在本地方法栈中JNI(即通常所说的Native方法)引用的对象。


Java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象(比如NullPointExcepiton、OutOfMemoryError)等,还有系统类加载器。


所有被同步锁(synchronized关键字)持有的对象。


反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。


当然除了上面这些固定的GC Roots集合以外,根据用户所选用的垃圾收集器以及当前回收的内存区域不同,还可以有其他对象“临时性”地加入,共同构成完整GC Roots集合。


例如分代收集和局部回收(Partial GC),如果只针对Java堆中某一块区域发起垃圾收集时(如最典型的只针对新生代的垃圾收集),必须考虑到内存区域是虚拟机自己的实现细节(在用户视角里任何内存区域都是不可见的),更不是孤立封闭的,所以某个区域里的对象完全有可能被位于堆中其他区域的对象所引用,这时候就需要将这些关联区域的对象也一并加入GC Roots集合中去,才能保证可达性分析的正确性。


目前最新的几款垃圾收集器无一例外都具备了局部回收的特征,为了避免GC Roots包含过多对象而过度膨胀,它们在实现上也做出了各种优化处理(如根节点枚举)。关于这些概念、优化技巧以及各种不同收集器实现等内容,将会在我的后面博客中讲解到。


四、四种引用


从上面我们可以知道无论是通过引用计数算法判断对象的引用数量,还是通过可达性分析算法判断对象是否引用链可达,判定对象是否存活都和“引用”离不开关系。


那么引用是什么?


在JDK 1.2版之前,Java里面的引用是很传统的定义:


如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称该reference数据是代表某块内存、某个对象的引用。


这种定义并没有什么不对,只是现在看来有些过于狭隘了,一个对象在这种定义下只有“被引用”或者“未被引用”两种状态,对于描述一些“食之无味,弃之可惜”的对象就显得无能为力。譬如我们希望能描述一类对象:当内存空间还足够时,能保留在内存之中,如果内存空间在进行垃圾收集后仍然非常紧张,那就可以抛弃这些对象——很多系统的缓存功能都符合这样的应用场景。


在JDK 1.2版之后,Java对引用的概念进行了扩充,将引用分为强引用(Strongly Re-ference)、软引用(Soft Reference)、弱引用(Weak Reference)和虚引用(Phantom Reference)4种,这4种引用强度依次逐渐减弱。


4.1 强引用

开发中用的最多的就是强引用了。


强引用声明格式:

Object obj=new Object();


只要某个对象与强引用关联,那么JVM在内存不足的情况下,宁愿抛出outOfMemoryError错误,也不会回收此类对象。


如果我们想要JVM回收此类被强引用关联的对象,我们可以显示地将str置为null,那么JVM就会在合适的时间回收此对象。


4.2 软引用


软引用是用来描述一些还有用,但非必须的对象。


如果某个 Java 对象只被软引用所指向,那么在 JVM 要新建一个对象的时候,如果当前虚拟机所剩下的堆内存不足以保存这个要新建的对象的时候(即虚拟机将要抛出 OutOfMemoryError 异常的时候),那么 JVM 会发起一次垃圾回收(gc)动作,将堆中所 只被非强引用 指向的对象回收,以提供更多的可用内存来新建这个对象,如果经过垃圾回收动作之后虚拟机的堆内存中仍然没有足够的可用空间来创建这个对象,那么虚拟机将抛出一个 OutOfMemoryError 异常


在JDK 1.2版之后提供了SoftReference类来实现软引用。


import java.lang.ref.SoftReference;
public class TestRef {
    public static void main(String args[]) {
        SoftReference<String> str = new SoftReference<String>(new String("abc"));
        System.out.println(str.get());
        //通知JVM进行内存回收
        System.gc();
        System.out.println(str.get());
    }
}


软引用适合做缓存,在内存足够时,直接通过软引用取值,无需从真实来源中查询数据,可以显著地提升网站性能。当内存不足时,能让JVM进行内存回收,从而删除缓存,这时候只能从真实来源查询数据。


4.3 弱引用

弱引用也是用来描述那些非必须对象,但是它的强度比软引用更弱一些,被弱引用关联的对象只 能生存到下一次垃圾收集发生为止。


当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。


在JDK 1.2版之后提供了WeakReference类来实现弱引用。


import java.lang.ref.WeakReference;
public class TestRef {
    public static void main(String args[]) {
        WeakReference<String> str = new WeakReference<String>(new String("abc"));
        System.out.println(str.get());
        //通知JVM进行内存回收
        System.gc();
        System.out.println(str.get());
    }
}


弱引用可以在回调函数在防止内存泄露。因为回调函数往往是匿名内部类,一个非静态的内部类会隐式地持有外部类的一个强引用,当JVM在回收外部类的时候,此时回调函数在某个线程里面被回调的时候,JVM就无法回收外部类,造成内存泄漏。在安卓activity内声明一个非静态的内部类时,如果考虑防止内存泄露的话,应当显示地声明此内部类持有外部类的一个弱引用。


4.4 虚引用

虚引用也称为“幽灵引用”或者“幻影引用”,它是最弱的一种引用关系。


这种引用有点特殊:被虚引用完全不会影响其所指向的对象的生命周期,也就是说一个 Java 对象是否被回收和指向它的虚引用完全没有任何关系。也不能通过虚引用来得到其指向的对象(其 get 方法直接返回 null)。


那么虚引用有什么作用呢?


虚引用一般会配合 引用队列(ReferenceQueue)来使用。当某个被虚引用指向的对象被回收时,我们可以在其引用队列中得到这个虚引用的对象作为其所指向的对象被回收的一个通知。我们将会在后面看到这种用法。


在JDK 1.2版之后提供了PhantomReference类来实现虚引用,但虚引用不能单独使用,必须配合引用队列一起使用。


import java.lang.ref.PhantomReference;
import java.lang.ref.ReferenceQueue;
public class TestRef {
    public static void main(String args[]) {
        ReferenceQueue<String> queue = new ReferenceQueue<>();
        PhantomReference<String> str = new PhantomReference<String>("abc", queue);
        System.out.println(str.get()); // 输出null
    }
}


五、生存或是死亡


image.png


上面提到过判定对象的死亡用的是可达性分析法,然而即使在可达性分析算法中判定为不可达的对象,也不是“非死不可”的,这时候它们暂时还处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记,随后进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。


假如对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,那么虚拟机将这两种情况都视为“没有必要执行”。


如果这个对象被判定为确有必要执行finalize()方法,那么该对象将会被放置在一个名为F-Queue的队列之中,并在稍后由一条由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize()方法。


这里所说的“执行”是指虚拟机会触发这个方法开始运行,但并不承诺一定会等待它运行结束。这样做的原因是,如果某个对象的finalize()方法执行缓慢,或者更极端地发生了死循环,将很可能导 致F-Queue队列中的其他对象永久处于等待,甚至导致整个内存回收子系统的崩溃。


finalize()方法是对象逃脱死亡命运的最后一次机会,稍后收集器将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移出“即将回收”的集合;如果对象这时候还没有逃脱,那基本上它就真的要被回收了。


从下面代码我们可以看到一个对象的finalize()被执行,但是它仍然可以存活。


/**
* 此代码演示了两点: 
* 1.对象可以在被GC时自我拯救。 
* 2.这种自救的机会只有一次,因为一个对象的finalize()方法最多只会被系统自动调用一次 
*/
public class FinalizeEscapeGC { 
    public static FinalizeEscapeGC SAVE_HOOK = null; 
    public void isAlive() { 
        System.out.println("yes, i am still alive :)"); 
    }
    @Override 
    protected void finalize() throws Throwable { 
        super.finalize(); 
        System.out.println("finalize method executed!"); 
        FinalizeEscapeGC.SAVE_HOOK = this; 
    }
    public static void main(String[] args) throws Throwable { 
        SAVE_HOOK = new FinalizeEscapeGC(); 
        //对象第一次成功拯救自己
        SAVE_HOOK = null; System.gc(); 
        // 因为Finalizer方法优先级很低,暂停0.5秒,以等待它 
        Thread.sleep(500); 
        if (SAVE_HOOK != null) { 
            SAVE_HOOK.isAlive(); 
        } else {
            System.out.println("no, i am dead :("); 
        }
        // 下面这段代码与上面的完全相同,但是这次自救却失败了
        SAVE_HOOK = null; System.gc(); 
        // 因为Finalizer方法优先级很低,暂停0.5秒,以等待它 
        Thread.sleep(500); 
        if (SAVE_HOOK != null) { 
            SAVE_HOOK.isAlive(); 
        } else { 
            System.out.println("no, i am dead :("); 
        } 
    }
}


运行结果


finalize method executed! 
yes, i am still alive :) 
no, i am dead :(


从代码的运行结果可以看到,SAVE_HOOK对象的finalize()方法确实被垃圾收集器触发过,并且在被收集前成功逃脱了。


另外一个值得注意的地方就是,代码中有两段完全一样的代码片段,执行结果却是一次逃脱成 功,一次失败了。这是因为任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失败了。


需要特别说明,上面关于对象死亡时finalize()方法的描述可能带点悲情的艺术加工,笔者并不鼓励大家使用这个方法来拯救对象。相反,笔者建议大家尽量避免使用它,因为它并不能等同于C和C++语言中的析构函数,而是Java刚诞生时为了使传统C、C++程序员更容易接受Java所做出的一项妥协。它的运行代价高昂,不确定性大,无法保证各个对象的调用顺序,如今已被官方明确声明为不推荐使用的语法。有些教材中描述它适合做“关闭外部资源”之类的清理性工作,这完全是对finalize() 方法用途的一种自我安慰。finalize()能做的所有工作,使用try-finally或者其他方式都可以做得更好、更及时,所以建议大家完全可以忘掉Java语言里面的这个方法。


六、方法区回收


看过我前面得博客就知道,方法区是内存共享的,而且有些人认为方法区(如HotSpot虚拟机中的元空间或者永久代)是没有垃圾收集行为的。


《Java虚拟机规范》中提到过可以不要求虚拟机在方法区中实现垃圾收集


为什么会如此?


  1. 方法区垃圾收集得性价比低
  2. 方法区垃圾回收条件苛刻
  3. 方法区的垃圾收集主要回收两部分内容:废弃的常量和不再使用的类型。


废弃得常量


回收废弃常量与回收Java堆中的对象非常类似。


举个常量池中字面量回收的例子,假如一个字符串“java”曾经进入常量池中,但是当前系统又没有任何一个字符串对象的值是“java”,换句话说,已经没有任何字符串对象引用常量池中的“java”常量,且虚拟机中也没有其他地方引用这个字面量。如果在这时发生内存回收,而且 垃圾收集器判断确有必要的话,这个“java”常量就将会被系统清理出常量池。常量池中其他类(接口)、方法、字段的符号引用也与此类似。


不再使用的类型


判定一个常量是否“废弃”还是相对简单,而要判定一个类型是否属于“不再被使用的类”的条件就比较苛刻了。需要同时满足下面三个条件:


该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。


加载类的ClassLoader已经被回收。(通常是很难达成,件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等)


该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过发射访问该类的方法。


Java虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是“被允许”,而并不是和对象一样,没有引用了就必然会回收。


关于是否要对类型进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制


在大量使用反射、动态代理、CGLib等字节码框架,动态生成JSP以及OSGi这类频繁自定义类加载器的场景中,通常都需要Java虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的内存压力


image.png


到此本文的内容就讲解完毕了,我们主要概括一下:


  1. 确定一个对象是垃圾方法有两种,引用计数法(主流虚拟机不再使用)、可达性分析法(主流虚拟机在使用)
  2. 扩展对象的四种引用(引用关联着对象是否是垃圾)
  3. 接着介绍了对象如何逃避死亡被回收的命运(重写finalize方法)
  4. 最后讨论了一下方法区垃圾回收(有垃圾回收,但条件苛刻)

既然知道了哪些是垃圾对象,那么下期就是介绍具体的垃圾回收方法了(先讲垃圾回收算法,后将算法实现)


我们下期见!


结束语


  • 由于博主才疏学浅,难免会有纰漏,假如你发现了错误或偏见的地方,还望留言给我指出来,我会对其加以修正。
  • 如果你觉得文章还不错,你的转发、分享、点赞、留言就是对我最大的鼓励。
  • 感谢您的阅读,十分欢迎并感谢您的关注。



目录
相关文章
|
20小时前
|
算法 Java
Java垃圾回收(Garbage Collection,GC)是Java虚拟机(JVM)的一种自动内存管理机制,用于在运行时自动回收不再使用的对象所占的内存空间
【6月更文挑战第18天】Java的GC自动回收内存,包括标记清除(产生碎片)、复制(效率低)、标记整理(兼顾连续性与效率)和分代收集(区分新生代和老年代,用不同算法优化)等策略。现代JVM通常采用分代收集,以平衡性能和内存利用率。
23 3
|
1天前
|
Java
在 Java 中,类是一种定义对象的模板,它包含数据成员(字段)和方法。
在 Java 中,类是一种定义对象的模板,它包含数据成员(字段)和方法。
|
1天前
|
搜索推荐 Java
Java多态:对象们的“千人千面”大揭秘!
【6月更文挑战第17天】Java中的多态展示了对象的多样性,允许同一方法根据对象类型产生不同行为。通过抽象类`Character`定义`attack()`方法,子类如`Warrior`、`Mage`、`Rogue`各自实现独特攻击。使用`Character`引用指向子类对象,调用`attack()`时,多态确保执行相应子类的实现,简化代码并增强可扩展性。当添加新职业,只需重写方法,原有代码保持不变,体现面向对象设计的优雅与效率。
|
1天前
|
Java
揭秘Java多态:为何同一消息,对象们却各有“心思”?
【6月更文挑战第17天】Java中的多态性让不同对象对同一方法有独特响应。以动物园为例,抽象类`Animal`定义`makeSound()`,子类如`Tiger`, `Lion`, `Monkey`继承并重写该方法。通过`Animal`引用调用,实际执行子类实现,展示动态绑定的威力。多态提升代码灵活性,支持扩展而无需改动原有代码,体现面向对象的核心思想。
|
3天前
|
安全 Java 数据安全/隐私保护
Java 封装:对象的“面纱”下,隐藏着怎样的世界?
【6月更文挑战第15天】Java封装是对象的隐私保护,它隐藏类的内部细节并设定访问接口。`Person`类展示了如何用`private`字段和公共getter/setter方法实现封装,确保数据安全性和代码可维护性。例如,`BankAccount`类封装了余额,只允许通过`deposit`、`withdraw`和`getBalance`方法操作。封装减少了外部干扰,增强安全性,提高可扩展性,是Java面向对象编程的核心原则之一。
|
3天前
|
安全 Java 数据安全/隐私保护
揭秘 Java 的“心灵封印术”:如何巧妙隐藏对象的小秘密?
【6月更文挑战第15天】Java的封装是面向对象的核心,它隐藏对象内部细节,只暴露必要的接口。比如`Student`类中,私有属性`name`和`age`通过公共方法访问,保证数据安全。同样,`BankAccount`类封装`balance`,仅允许通过`deposit`、`withdraw`和`getBalance`操作,防止数据误改。封装使代码更健壮、易维护,是编程的强力工具。
|
3天前
|
Java 开发者
Java 面向对象编程实战:从类定义到对象应用,让你成为高手!
【6月更文挑战第15天】在Java中,掌握面向对象编程至关重要。通过创建`Book`类,展示了属性如`title`和`author`,以及构造方法和getter方法。实例化对象如`book1`和`book2`,并访问其属性。进一步扩展类,添加`pages`和`calculateReadingTime`方法,显示了类的可扩展性。在更大规模的项目中,如电商系统,可以定义`Product`、`User`和`Order`类,利用对象表示实体和它们的交互。实践是精通Java OOP的关键,不断学习和应用以提升技能。
|
3天前
|
Java 开发者
为什么 Java 的类和对象如此重要?看完这篇你就懂了!
【6月更文挑战第15天】在Java中,类和对象是核心概念。类作为蓝图定义数据(如角色的名称和健康值)和行为(如`takeDamage`方法),而对象是类的实例,允许交互(如战士受伤)。通过继承,如`Circle`和`Rectangle`扩展`Shape`类,实现多态性,增强代码灵活性。类和对象促进代码组织、复用和可维护性,是高效软件开发的基础。
|
3天前
|
设计模式 Java
一文掌握 Java 面向对象精髓:从类定义到对象实战
【6月更文挑战第15天】Java面向对象编程初学者指南:类是对象模板,如`Person`类含`name`和`age`属性。创建对象用`new`,如`Person person = new Person()`。访问属性如`person.name=&quot;Alice&quot;`,调用方法如`person.sayHello()`。类能继承,如`Student extends Person`。对象间共享数据可传参或共用引用。多态性允许父类引用调用子类方法。注意对象生命周期和内存管理,避免内存泄漏。通过实践和理解这些基础,提升编程技能。
|
3天前
|
安全 Java
Java 对象创建与使用:你真的会用吗?
【6月更文挑战第15天】在Java中,对象创建涉及`new`关键字和构造器,用于初始化。使用对象时注重属性和方法的访问,遵循命名规范。关注对象生命周期,避免过度创建,如在循环内,以减少内存消耗和提高性能。还要考虑线程安全,尤其在多线程环境下,确保正确同步以防止数据不一致。通过优化对象的创建与使用,提升代码效率和可靠性。