98. 我说说你对Java GC机制的理解?(二)
分代与GC机制
嗯,听起来这样就可以了?但是实际情况下,很不幸,在JVM中绝大部分对象都是英年早逝的,在编码时大部分堆中的内存都是短暂临时分配的,所以无论是效率还是开销方面,按上面那样进行 GC往往是无法满足我们需求的。而且,实际上随着分配的对象增多, GC的时间与开销将会放大。所以,JVM的内存被分为了三个主要部分:新生代,老年代和永久代。
新生代
所有新产生的对象全部都在新生代中, Eden区保存最新的对象,有两个 SurvivorSpace—— S1和 S0,三个区域的比例大致为 8:1:1。当新生代的 Eden区满了,将触发一次 GC,我们把新生代中的 GC称为 minor garbage collections。minor garbage collections是一种 Stopthe world事件,比如你妈在打扫时,会把你赶出去,而不是你一边扔垃圾她一边打扫。
我们来看下对象在堆中的分配过程,首先有新的对象进入时,默认放入新生代的 Eden区, S区都是默认为空的。下面对象的数字代表经历了多少次 GC,也就是对象的年龄。
当 eden区满了,触发 minor garbage collections,这时还有被引用的对象,就会被分配到 S0区域,剩下没有被引用的对象就都会被清除。
再一次 GC时, S0区的部分对象很可能会出现没有引用的,被引用的对象以及 S0中的存活对象,会被一起移动到 S1中。eden和 S0中的未引用对象会被全部清除。
接下来就是无限循环上面的步骤了,当新生代中存活的对象超过了一定的【年龄】,会被分配至老年代的 Tenured区中。这个年龄可以通过参数 MaxTenuringThreshold设定,默认值为 15,图中的例子为 8次。
新生代管理内存采用的算法为 GC复制算法( CopyingGC),也叫标记-复制法,原理是把内存分为两个空间:一个 From空间,一个 To空间,对象一开始只在 From空间分配, To空间是空闲的。GC时把存活的对象从 From空间复制粘贴到 To空间,之后把 To空间变成新的 From空间,原来的 From空间变成 To空间。
首先标记不可达对象。
然后移动存活的对象到 to区,并保证他们在内存中连续。
清扫垃圾。
可以看到上图操作后内存几乎都是连续的,所以它的效率是非常高的,但是相对的吞吐量会较大。并且,把内存一分为二,占用了将近一半的可用内存。用一段伪代码来实现大致为下。
void copying(){ $free = $to_start // $free表示To区占用偏移量,每复制成功一个对象obj, // $free向前移动size(obj) for(r : $roots) *r = copy(*r) // 复制成功后返回新的引用 swap($from_start, $to_start) // GC完成后交互From区与To区的指针 }
老年代
老年代用来存储活时间较长的对象,老年代区域的 GC是 major garbage collection,老年代中的内存不够时,就会触发一次。这也是一个 Stopthe world事件,但是看名字就知道,这个回收过程会相当慢,因为这包括了对新生代和老年代所有对象的回收,也叫 FullGC。
老年代管理内存最早采用的算法为标记-清理算法,这个算法很好理解,结合 GC Root的定义,我们会把所有不可达的对象全部标记进行清除。
在清除前,黄色的为不可达对象。
在清除后,全部都变成可达对象。
那么,这个算法的劣势很好理解:对,会在标记清除的过程中产生大量的内存碎片,Java在分配内存时通常是按连续内存分配,这样我们会浪费很多内存。所以,现在的 JVM GC在老年代都是使用标记-压缩清除方法,将上图在清除后的内存进行整理和压缩,以保证内存连续,虽然这个算法的效率是三种算法里最低的。
永久代
永久代位于方法区,主要存放元数据,例如 Class、 Method的元信息,与 GC要回收的对象其实关系并不是很大,我们可以几乎忽略其对 GC的影响。除了 JavaHotSpot这种较新的虚拟机技术,会回收无用的常量和的类,以免大量运用反射这类频繁自定义 ClassLoader的操作时方法区溢出。