4 GC算法
知道了如何判定:
- 一个对象是无效对象
- 一个类是无用类
- 一个常量是废弃常量
也就知道了垃圾收集器会清除哪些数据,那么它们是如何清除这些数据的呢?
4.1 标记-清除算法(Mark-Sweep)
最基础的收集算法,因为后续算法也都是基于该思路,对其不足之处进行优化而得。
- 首先判断需要清除哪些数据,并给它们做上标记
- 然后清除被标记的数据
缺陷
标记和清除过程效率都不高,且标记清除之后存在大量内存碎片,降低了空间利用率这会导致日后因为存储大对象时无法找到足够连续内存而提前触发GC。
4.2 复制算法(Copying)
- 将内存分成大小相等两份,只将数据存储在其中一块上.当需要回收时,也是首先标记出废弃的数据,然后将有用的数据复制到另一块内存上,最后将第一块内存全部清除.
- 分析
这种算法避免了空间碎片,但内存缩小了一半.
而且每次都需要将有用的数据全部复制到另一片内存上去,效率不高.
解决空间利用率问题
在新生代中,由于大量的对象都是"朝生夕死",也就是一次垃圾收集后只有少量对象存活,因此我们可以将内存划分成三块:Eden、Survior1、Survior2,内存大小分别是8:1:1.分配内存时,只使用Eden和一块Survior1.当发现Eden+Survior1的内存即将满时,JVM会发起一次MinorGC,清除掉废弃的对象,并将所有存活下来的对象复制到另一块Survior2中.接下来就使用Survior2+Eden进行内存分配.
通过这种方式,只需要浪费10%的内存空间即可实现带有压缩功能的垃圾收集方法,避免了内存碎片的问题.
什么是分配担保?
当JVM准备为一个对象分配内存空间时,发现此时Eden+Survior中空闲的区域无法装下该对象,那么就会触发MinorGC,对该区域的废弃对象进行回收.但如果MinorGC过后只有少量对象被回收,仍然无法装下新对象,那么此时需要将Eden+Survior中的所有对象都转移到老年代中,然后再将新对象存入Eden区.这个过程就是"分配担保".
4.3 标记-整理算法(Mark-Compact)
效率偏低。
GC前的标记过程仍与"标记-清除"一样,但后续不是直接清理可回收对象,而是将所有存活的对象移到一端,然后直接清掉端边界之外的内存。
分析
一种老年代GC算法,老年代中的对象一般寿命较长,因此每次GC后会有大量对象存活,所以若选用"复制"算法,则每次需要很多的复制操作,效率很低。
在新生代中使用"复制"算法,当Eden+Survior中都装不下某对象时,可使用老年代的内存进行"分配担保"。而若在老年代使用“复制”算法,若老年代出现Eden+Survior装不下某个对象时,没有其他区域给它作分配担保。因此,老年代中一般使用"标记-整理"算法。
4.4 分代收集算法(Generational Collection)
当前商业虚拟机都采用此算法.根据对象存活周期的不同将Java堆划分为老年代和新生代,根据各个年代的特点使用最佳的收集算法.
- 老年代中对象存活率高,无额外空间对其分配担保,必须使用"标记-清理"或"标记-整理"算法;
- 新生代中存放"朝生夕死"的对象那就用复制算法,只需要付出少量存活对象的复制成本就可以完成收集.
5 Java中引用的种类
Java中根据生命周期的长短,将引用分为4类
强引用
我们平时所使用的引用就是强引用.
类似A a = new A();
也就是通过关键字new创建的对象所关联的引用就是强引用.
只要强引用还存在,该对象永远不会被回收.
软引用
一些还有用但并非必需的对象
只有当堆即将发生OOM异常时,JVM才会回收软引用所指向的对象.
软引用通过SoftReference类实现.
软引用的生命周期比强引用短一些.
弱引用
也是描述非必需对象,比软引用更弱
所关联的对象只能存活到下一次GC发生前.
只要垃圾收集器工作,无论内存是否足够,弱引用所关联的对象都会被回收.
弱引用通过WeakReference类实现.
虚引用
也叫幽灵(幻影)引用,最弱的引用关系.
它和没有引用没有区别,无法通过虚引用取得对象实例.
设置虚引用唯一的作用就是在该对象被回收之前收到一条系统通知.
虚引用通过PhantomReference类来实现.