java堆的特点
《深入理解java虚拟机》是什么描述java堆的
- Java堆(Java Heap)是java虚拟机所管理的内存中最大的一块
- java堆被所有线程共享的一块内存区域
- 虚拟机启动时创建java堆
- java堆的唯一目的就是存放对象实例。
- java堆是垃圾收集器管理的主要区域。
- 从内存回收的角度来看, 由于现在收集器基本都采用分代收集算法, 所以Java堆可以细分为:新生代(Young)和老年代(Old)。 新生代又被划分为三个区域Eden、From Survivor, To Survivor等。无论怎么划分,最终存储的都是实例对象, 进一步划分的目的是为了更好的回收内存, 或者更快的分配内存。
- java堆的大小是可扩展的, 通过-Xmx和-Xms控制。
- 如果堆内存不够分配实例对象, 并且对也无法在扩展时, 将会抛出outOfMemoryError异常。
堆内存划分:
- 堆大小 = 新生代 + 老年代。堆的大小可通过参数–Xms(堆的初始容量)、-Xmx(堆的最大容量) 来指定。
- 其中,新生代 ( Young ) 被细分为 Eden 和 两个 Survivor 区域,这两个 Survivor 区域分别被命名为 from 和 to,以示区分。默认的,Edem : from : to = 8 : 1 : 1 。(可以通过参数 –XX:SurvivorRatio 来设定 。
- 即: Eden = 8/10 的新生代空间大小,from = to = 1/10 的新生代空间大小。
- JVM 每次只会使用 Eden 和其中的一块 Survivor 区域来为对象服务,所以无论什么时候,总是有一块 Survivor 区域是空闲着的。
- 新生代实际可用的内存空间为 9/10 ( 即90% )的新生代空间。
堆的垃圾回收方式
java堆是GC垃圾回收的主要区域。 GC分为两种: Minor GC、Full GC(也叫做Major GC).
Minor GC(简称GC)
Minor GC是发生在新生代中的垃圾收集动作, 所采用的是复制算法。
GC一般为堆空间某个区发生了垃圾回收,
新生代(Young)几乎是所有java对象出生的地方。即java对象申请的内存以及存放都是在这个地方。java中的大部分对象通常不会长久的存活, 具有朝生夕死的特点。
当一个对象被判定为“死亡”的时候, GC就有责任来回收掉这部分对象的内存空间。
新生代是收集垃圾的频繁区域。
回收过程如下:
当对象在 Eden ( 包括一个 Survivor 区域,这里假设是 from 区域 ) 出生后,在经过一次 Minor GC 后,如果对象还存活,并且能够被另外一块 Survivor 区域所容纳(上面已经假设为 from 区域,这里应为 to 区域,即 to 区域有足够的内存空间来存储 Eden 和 from 区域中存活的对象 ),则使用复制算法将这些仍然还存活的对象复制到另外一块 Survivor 区域 ( 即 to 区域 ) 中,然后清理所使用过的 Eden 以及 Survivor 区域 ( 即 from 区域 ),并且将这些对象的年龄设置为1,以后对象在 Survivor 区每熬过一次 Minor GC,就将对象的年龄 + 1,当对象的年龄达到某个值时 ( 默认是 15 岁,可以通过参数 -XX:MaxTenuringThreshold 来设定 ),这些对象就会成为老年代。
但这也不是一定的,对于一些较大的对象 ( 即需要分配一块较大的连续内存空间 ) 则是直接进入到老年代。
Full GC
Full GC 基本都是整个堆空间及持久代发生了垃圾回收,所采用的是标记-清除算法。
现实的生活中,老年代的人通常会比新生代的人 “早死”。堆内存中的老年代(Old)不同于这个,老年代里面的对象几乎个个都是在 Survivor 区域中熬过来的,它们是不会那么容易就 “死掉” 了的。因此,Full GC 发生的次数不会有 Minor GC 那么频繁,并且做一次 Full GC 要比进行一次 Minor GC 的时间更长,一般是Minor GC的 10倍以上。
另外,标记-清除算法收集垃圾的时候会产生许多的内存碎片 ( 即不连续的内存空间 ),此后需要为较大的对象分配内存空间时,若无法找到足够的连续的内存空间,就会提前触发一次 GC 的收集动作
---------------------------------------------------------------------
下面我们来分析一下GC日志:
如何在eclipse中打印GC日志? 参考这篇文章: 如何在eclipse中打印gc日志.
我们首先写一段代码:
public static void main(String[] args) { Object obj = new Object(); System.gc(); System.out.println(); obj = new Object(); obj = new Object(); System.gc(); System.out.println(); }
在Run as - Run Configuration中配置参数,使得控制台能够显示 GC 相关的日志信息,执行上面代码,下面是其中一次执行的结果。
-verbose:gc
-XX:+PrintGCTimeStamps
-XX:+PrintGCDetails
再看下面这个图:
第一次System.gc()
第二次执行System.gc()
对比这两次gc的结果:
从Full GC中可以看出, 新生代的可用内存约为38M, 老年代可用内存约为86M, 堆的可用总内存约为124M.
可以看出>新生代内存占用jvm堆内存的1/3, 老年代内存占用jvm堆总内存的2/3. GC堆新生代内存回收比较乐观. 对老年代,以及方法区的回收并不明显, 或者说不如新生代.
除此之外:
再来观察: 第一次gc, 新生代回收情况是665K->648K, 而老年代将新生代的648K回收至0K. 放入了老年代, 所以老年代是从0K增加到470K. 所以,新生代回收内存情况是665K->648K, 老年代回收情况是648K->470K.
第二次gc看出, Full GC处理时间是GC的17倍.
--------------------------------------------------------------
JVM参数选项
下面只列举其中的几个常用和容易掌握的配置选项:
我们再来分析一个案例:
------------源代码 开始------------
public static void main(String[] args) { new Test2().doTest(); } public void doTest() { Integer M = new Integer(1024 * 1024 * 1); // 单位, 兆(M) byte[] bytes = new byte[1 * M]; // 申请 1M 大小的内存空间 bytes = null; // 断开引用链 System.gc(); // 通知 GC 收集垃圾 System.out.println(); bytes = new byte[1 * M]; // 重新申请 1M 大小的内存空间 bytes = new byte[1 * M]; // 再次申请 1M 大小的内存空间 System.gc(); System.out.println(); }
------------源代码 结束------------
执行结果:
从打印结果可以看出
1. 新生代内存空间约为38M, 其中eden空间约为33M, from Survivor 空间约为5M, to Survivor空间约为5M.
2. 这里我们设置的-Xmn为43M, 也就是说指定的新生代的空间是43M, 那为什么打印结果显示的时38M呢?另外的5M哪里去了?
其实是这样的: 新生代 = Eden + From Survivor + To Survivor = 33 + 5+ 5 = 43M. 可见新生代的内存空间确实是43M, 按照Xmn分配得来的.
3. 而且这里指定了SurvivorRatio = 8. 因此, eden = 8/10 的新生代空间 = 8/10 * 43 = 38M。
from = to = 1/10 的新生代空间 = 1/10 * 43 = 5M。
4. 堆信息中新生代的 total 18432K 是这样来的: eden + 1 个 survivor = 33K + 5K = 18432K,即约为 38M。
5. 因为 jvm 每次只是用新生代中的 eden 和 一个 survivor,因此新生代实际的可用内存空间大小为所指定的 90%。
因此可以知道,这里新生代的内存空间指的是新生代可用的总的内存空间,而不是指整个新生代的空间大小。
6. 另外,可以看出老年代的内存空间为 86016K ( 约 86M ),堆大小 = 新生代 + 老年代。因此在这里,老年代 = 堆大小 – 新生代 = 124 – 38 = 86M。(注: 这里应该是减去43的, 可我这里减去43以后,就不是86了, 可能是不能版本的虚拟机, 细节不一样)
7. 最后,这里还指定了 PermSize = 21m,PermGen 即永久代 ( 方法区 ),它还有一个名字,叫非堆,主要用来存储由 jvm 加载的类文件信息、常量、静态变量等。
-----------------------------------------------------------------
打个盹,回到 doTest() 方法中,可以看到代码在第 17、21、22 这三行中分别申请了一块 1M 大小的内存空间,并在 19 和 23 这两行中分别显式的调用了 System.gc()。从控制台打印的信息来看,每次调 System.gc(),是先进行 Minor GC,然后再进行 Full GC。
第 19 行触发的 Minor GC 收集分析:
从信息 PSYoungGen : 1689K -> 632K,可以知道,在第 17 行为 bytes 分配的内存空间已经被回收完成。
引起 GC 回收这 1M 内存空间的因素是第 18 行的 bytes = null; bytes 为 null 表明之前申请的那 1M 大小的内存空间现在已经没有任何引用变量在使用它了,并且在内存中它处于一种不可到达状态 ( 即没有任何引用链与 GC Roots 相连 )。那么,当 Minor GC 发生的时候,GC 就会来回收掉这部分的内存空间。
第 19 行触发的 Full GC 收集分析:
在 Minor GC 的时候,信息显示 PSYoungGen : 1689K -> 632K,再看看 Full GC 中显示的 PSYoungGen : 632K -> 0K,可以看出,Full GC 后,新生代的内存使用变成0K 了
刚刚说到 Full GC 后,新生代的内存使用从 632K 变成 0K 了,那么这 632K 到底哪去了 ? 难道都被 GC 当成垃圾回收掉了 ? 当然不是了。我们在 main 方法中 new 了一个 Test 类的实例,这里的 Test 类的实例属于对象,它应该被分配到新生代内存当中,现在还在调用这个实例的 doTest 方法呢,GC 不可能在这个时候来回收它的。
接着往下看 Full GC 的信息,会发现一个很有趣的现象,PSOldGen: 0K -> 470K,可以看到,Full GC 后,老年代的内存使用从 0K 变成了 160K,想必你已经猜到大概是怎么回事了。当 Full GC 进行的时候,默认的方式是尽量清空新生代 ( YoungGen ),因此在调 System.gc() 时,新生代 ( YoungGen ) 中存活的对象会提前进入老年代。
第 23 行触发的 Minor GC 收集分析:
从信息 PSYoungGen : 4045K -> 1088K,可以知道,在第 21 行创建的,大小为 1M 的数组被 GC 回收了。在第 22 行创建的,大小也为 1M 的数组由于 bytes 引用变量还在引用它,因此,它暂时未被 GC 回收。
第 23 行触发的 Full GC 收集分析:
在 Minor GC 的时候,信息显示 PSYoungGen : 4045K -> 1088K,Full GC 中显示的 PSYoungGen : 1088K -> 0K,以及 PSOldGen: 470K -> 1494K,可以知道,新生代 ( YoungGen ) 中存活的对象又提前进入老年代了。