概述
在JVM的运行时数据区中,程序计数器、JVM栈和本地方法栈随线程而生,随线程而灭,内存分配和回收具备确定性,因此这几个区域不需要过多考虑内存回收问题,因为方法结束或者线程结束时,内存自然就跟随着回收了。而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,只有在程序处于运行期才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关心的是这部分内存。
对象存活判定算法
在堆中存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象中哪些还“存活”着,那些已经“死去”(即不可能再被任何途径使用的对象)
1. 引用的概念
在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用和虚引用四种,这四种引用强度依次减弱。
- 强引用(Strong Reference)
- 指创建一个对象并把这个对象赋值给一个引用变量
Object obj = new Object();
- 只要强引用存在,即使抛出OutOfMemoryError异常,垃圾收集器也不会回收被引用的对象。
- 指创建一个对象并把这个对象赋值给一个引用变量
- 软引用(Soft Referrence)
- 用来描述一些还有用但非必须的对象。
- 对于软引用关联的对象,在内存不足时会被回收。
- 弱引用(Weak Reference)
- 用来描述非必须对象,但强度比软引用更弱。
- 无论当前内存是否足够,都会被回收。
- 虚引用(Phantom Reference)
- 不影响对象生存时间,也无法通过虚引用取得对象实例。
- 存在意义在于与引用队列关联使用,判断被虚引用关联的对象是否即将被回收。
推荐阅读:Java的四种引用方式
2. 引用计数算法
- 实现方式:给对象中添加一个引用计数器,每当有一个地方去引用它,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器值为0的对象就是不可能再被使用的。
- 这种算法实现简单、判定效率高,但是很难解决对象之间相互循环引用的问题。
- 虚拟机不是通过引用计数算法来判断对象是否存活。
3. 可达性分析算法
- 实现方式:通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,证明此对象是不可引用的。
- 在Java中,可作为GC Roots的对象包括以下几种:
- JVM栈(栈帧中的本地变量表)中引用的对象;
- 方法区中类的静态属性引用的对象;
- 方法区中常量引用的对象;
- 本地方法栈中JNI(即常说的Native方法)引用的对象。
- 当然,可达性分析算法中不可达的对象并不是一定会被回收,如果这个对象在执行finalize()方法时,重新与引用链上的对象关联起来,就会被移除出“即将回收”集合。
4. 方法区回收
- JVM规范中说过可以不要求JVM在方法区实现垃圾回收,方法区的垃圾回收效率十分低。
- 方法区的垃圾回收主要回收两部分内容:
- 废弃常量的回收与Java堆中对象的回收十分类似,即没有被任何其他地方引用就会被回收。
- 满足以下条件会被判定为无用的类
- 该类所有的实例都已经被回收,即Java堆中不存在该类的任何实例;
- 加载该类的 ClassLoader 已经被回收;
- 该类对应的 java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
垃圾收集算法
首先可以先看看下面这篇博客,了解一下新生代和老年代的概念:新生代和老年代
接下来介绍几种垃圾收集算法。
1. 复制算法
- 算法思想:将可用内存按容量划分为大小相等的两块,每次只使用其中给一块,当这一块的内存用完了,就将还存活的对象复制到另一块,再将已使用的一块内存全部清理掉。
- 优点:每次都对整个半区进行回收,不会产生内存碎片,实现简单,运行高效。
- 缺点:相当于将可用内存缩小为一半,使用率太低。
2. 标记—清除算法
- 算法思想:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
- 不足:
- 标记和清除两个过程的效率都不高;
- 标记清除后会产生大量不连续的内存碎片,造成后面无法为较大对象分配空间,频繁触发垃圾收集,影响系统性能。
3. 标记—整理算法
- 算法思想:首先标记出所有需要回收的对象,然后将所有存活的对象移动到一端,然后直接清理端边界以外的全部内存。
- 优点:可以应对大量对象存活,只有少量内存需要回收的情况,适合老年代使用。
4. 分代收集算法
- 这种算法被当代虚拟机广泛使用。
- 算法思想:根据对象存活周期将Java堆分为新生代和老年代,分别使用合适的算法进行垃圾收集。
- 新生代对象存活率低,使用复制算法,只需付出少量存活对象的复制成本就可以完成收集。
IBM公司的专门研究表明,新生代中的对象98%是“朝生夕死”,所以可以将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor空间。回收时,将这两块空间中存活的对象复制到另一块Survivor空间中,最后清理掉Eden和Survivor空间。这样空间使用率就达到了90%。当然我们不能保证每次都只有不多于10%的对象存活,这时就需要依赖老年代空间进行分配担保,即让survivor空间存放不下的对象通过分配担保机制进入老年代。
- 老年代对象存活率高,使用标记—清理算法或者标记—整理算法。
上一篇:JVM笔记 | Java内存管理