java堆内存详解

简介: java堆内存详解

java堆的特点


《深入理解java虚拟机》是什么描述java堆的


  • Java堆(Java Heap)是java虚拟机所管理的内存中最大的一块
  • java堆被所有线程共享的一块内存区域
  • 虚拟机启动时创建java堆
  • java堆的唯一目的就是存放对象实例。
  • java堆是垃圾收集器管理的主要区域。
  • 从内存回收的角度来看, 由于现在收集器基本都采用分代收集算法, 所以Java堆可以细分为:新生代(Young)和老年代(Old)。 新生代又被划分为三个区域Eden、From Survivor, To Survivor等。无论怎么划分,最终存储的都是实例对象, 进一步划分的目的是为了更好的回收内存, 或者更快的分配内存。
  • java堆的大小是可扩展的, 通过-Xmx和-Xms控制。
  • 如果堆内存不够分配实例对象, 并且对也无法在扩展时, 将会抛出outOfMemoryError异常。


1187916-20171130145507089-940285672.png



堆内存划分:

 

  • 堆大小 = 新生代 + 老年代。堆的大小可通过参数–Xms(堆的初始容量)、-Xmx(堆的最大容量) 来指定。
  • 其中,新生代 ( Young ) 被细分为 Eden 和 两个 Survivor 区域,这两个 Survivor 区域分别被命名为 from 和 to,以示区分。默认的,Edem : from : to = 8 : 1 : 1 。(可以通过参数 –XX:SurvivorRatio 来设定 。
  • 即: Eden = 8/10 的新生代空间大小,from = to = 1/10 的新生代空间大小。
  • JVM 每次只会使用 Eden 和其中的一块 Survivor 区域来为对象服务,所以无论什么时候,总是有一块 Survivor 区域是空闲着的。
  • 新生代实际可用的内存空间为 9/10 ( 即90% )的新生代空间。

 

堆的垃圾回收方式

java堆是GC垃圾回收的主要区域。 GC分为两种: Minor GC、Full GC(也叫做Major GC).


Minor GC(简称GC)

Minor GC是发生在新生代中的垃圾收集动作, 所采用的是复制算法

GC一般为堆空间某个区发生了垃圾回收,

新生代(Young)几乎是所有java对象出生的地方。即java对象申请的内存以及存放都是在这个地方。java中的大部分对象通常不会长久的存活, 具有朝生夕死的特点。

当一个对象被判定为“死亡”的时候, GC就有责任来回收掉这部分对象的内存空间。

新生代是收集垃圾的频繁区域。


  回收过程如下:


当对象在 Eden ( 包括一个 Survivor 区域,这里假设是 from 区域 ) 出生后,在经过一次 Minor GC 后,如果对象还存活,并且能够被另外一块 Survivor 区域所容纳(上面已经假设为 from 区域,这里应为 to 区域,即 to 区域有足够的内存空间来存储 Eden 和 from 区域中存活的对象 ),则使用复制算法将这些仍然还存活的对象复制到另外一块 Survivor 区域 ( 即 to 区域 ) 中,然后清理所使用过的 Eden 以及 Survivor 区域 ( 即 from 区域 ),并且将这些对象的年龄设置为1,以后对象在 Survivor 区每熬过一次 Minor GC,就将对象的年龄 + 1,当对象的年龄达到某个值时 ( 默认是 15 岁,可以通过参数 -XX:MaxTenuringThreshold 来设定 ),这些对象就会成为老年代。

但这也不是一定的,对于一些较大的对象 ( 即需要分配一块较大的连续内存空间 ) 则是直接进入到老年代。


Full GC


Full GC 基本都是整个堆空间及持久代发生了垃圾回收,所采用的是标记-清除算法


现实的生活中,老年代的人通常会比新生代的人 “早死”。堆内存中的老年代(Old)不同于这个,老年代里面的对象几乎个个都是在 Survivor 区域中熬过来的,它们是不会那么容易就 “死掉” 了的。因此,Full GC 发生的次数不会有 Minor GC 那么频繁,并且做一次 Full GC 要比进行一次 Minor GC 的时间更长,一般是Minor GC的 10倍以上。


另外,标记-清除算法收集垃圾的时候会产生许多的内存碎片 ( 即不连续的内存空间 ),此后需要为较大的对象分配内存空间时,若无法找到足够的连续的内存空间,就会提前触发一次 GC 的收集动作


---------------------------------------------------------------------

下面我们来分析一下GC日志:


如何在eclipse中打印GC日志? 参考这篇文章: 如何在eclipse中打印gc日志.


我们首先写一段代码:


public static void main(String[] args) {
Object obj = new Object();
System.gc();
System.out.println();
obj = new Object();
obj = new Object();
System.gc();
System.out.println();
}

在Run as - Run Configuration中配置参数,使得控制台能够显示 GC 相关的日志信息,执行上面代码,下面是其中一次执行的结果。

 1187916-20171130145558636-703142101.png


-verbose:gc

-XX:+PrintGCTimeStamps

-XX:+PrintGCDetails

 1187916-20171130145611776-963874337.png

再看下面这个图:

第一次System.gc()

1187916-20171130145628058-316319278.png

第二次执行System.gc()

1187916-20171130145641636-2125948204.png

对比这两次gc的结果:

从Full GC中可以看出, 新生代的可用内存约为38M, 老年代可用内存约为86M, 堆的可用总内存约为124M.

可以看出>新生代内存占用jvm堆内存的1/3, 老年代内存占用jvm堆总内存的2/3. GC堆新生代内存回收比较乐观. 对老年代,以及方法区的回收并不明显, 或者说不如新生代.


除此之外:

再来观察: 第一次gc, 新生代回收情况是665K->648K, 而老年代将新生代的648K回收至0K. 放入了老年代, 所以老年代是从0K增加到470K. 所以,新生代回收内存情况是665K->648K, 老年代回收情况是648K->470K.


第二次gc看出, Full GC处理时间是GC的17倍.


--------------------------------------------------------------


JVM参数选项

下面只列举其中的几个常用和容易掌握的配置选项:

 

1187916-20171130145722683-1410152035.png

我们再来分析一个案例:

------------源代码 开始------------

public static void main(String[] args) {
new Test2().doTest();
}
public void doTest() {
Integer M = new Integer(1024 * 1024 * 1); // 单位, 兆(M)
byte[] bytes = new byte[1 * M]; // 申请 1M 大小的内存空间
bytes = null; // 断开引用链
System.gc(); // 通知 GC 收集垃圾
System.out.println();
bytes = new byte[1 * M]; // 重新申请 1M 大小的内存空间
bytes = new byte[1 * M]; // 再次申请 1M 大小的内存空间
System.gc();
System.out.println();
}

------------源代码 结束------------

1187916-20171130145754183-290127967.png

执行结果:

1187916-20171130145802417-1998247527.png


从打印结果可以看出


1. 新生代内存空间约为38M, 其中eden空间约为33M, from Survivor 空间约为5M, to Survivor空间约为5M.


2. 这里我们设置的-Xmn为43M, 也就是说指定的新生代的空间是43M, 那为什么打印结果显示的时38M呢?另外的5M哪里去了?


其实是这样的: 新生代 = Eden + From Survivor + To Survivor = 33 + 5+ 5 = 43M. 可见新生代的内存空间确实是43M, 按照Xmn分配得来的.


3. 而且这里指定了SurvivorRatio = 8. 因此, eden = 8/10 的新生代空间 = 8/10 * 43 = 38M。


from = to = 1/10 的新生代空间 = 1/10 * 43 = 5M。


4. 堆信息中新生代的 total 18432K 是这样来的: eden + 1 个 survivor = 33K + 5K = 18432K,即约为 38M。


5. 因为 jvm 每次只是用新生代中的 eden 和 一个 survivor,因此新生代实际的可用内存空间大小为所指定的 90%。


 因此可以知道,这里新生代的内存空间指的是新生代可用的总的内存空间,而不是指整个新生代的空间大小。


6. 另外,可以看出老年代的内存空间为 86016K ( 约 86M ),堆大小 = 新生代 + 老年代。因此在这里,老年代 = 堆大小 – 新生代 = 124 – 38 = 86M。(注: 这里应该是减去43的, 可我这里减去43以后,就不是86了, 可能是不能版本的虚拟机, 细节不一样)


7. 最后,这里还指定了 PermSize = 21m,PermGen 即永久代 ( 方法区 ),它还有一个名字,叫非堆,主要用来存储由 jvm 加载的类文件信息、常量、静态变量等。


-----------------------------------------------------------------

 

打个盹,回到 doTest() 方法中,可以看到代码在第 17、21、22 这三行中分别申请了一块 1M 大小的内存空间,并在 19 和 23 这两行中分别显式的调用了 System.gc()。从控制台打印的信息来看,每次调 System.gc(),是先进行 Minor GC,然后再进行 Full GC。

第 19 行触发的 Minor GC 收集分析:


从信息 PSYoungGen : 1689K -> 632K,可以知道,在第 17 行为 bytes 分配的内存空间已经被回收完成。


引起 GC 回收这 1M 内存空间的因素是第 18 行的 bytes = null; bytes 为 null 表明之前申请的那 1M 大小的内存空间现在已经没有任何引用变量在使用它了,并且在内存中它处于一种不可到达状态 ( 即没有任何引用链与 GC Roots 相连 )。那么,当 Minor GC 发生的时候,GC 就会来回收掉这部分的内存空间。


第 19 行触发的 Full GC 收集分析:


在 Minor GC 的时候,信息显示 PSYoungGen : 1689K -> 632K,再看看 Full GC 中显示的 PSYoungGen : 632K -> 0K,可以看出,Full GC 后,新生代的内存使用变成0K 了

刚刚说到 Full GC 后,新生代的内存使用从 632K 变成 0K 了,那么这 632K 到底哪去了 ? 难道都被 GC 当成垃圾回收掉了 ? 当然不是了。我们在 main 方法中 new 了一个 Test 类的实例,这里的 Test 类的实例属于对象,它应该被分配到新生代内存当中,现在还在调用这个实例的 doTest 方法呢,GC 不可能在这个时候来回收它的。


接着往下看 Full GC 的信息,会发现一个很有趣的现象,PSOldGen: 0K -> 470K,可以看到,Full GC 后,老年代的内存使用从 0K 变成了 160K,想必你已经猜到大概是怎么回事了。当 Full GC 进行的时候,默认的方式是尽量清空新生代 ( YoungGen ),因此在调 System.gc() 时,新生代 ( YoungGen ) 中存活的对象会提前进入老年代。


第 23 行触发的 Minor GC 收集分析:


从信息 PSYoungGen : 4045K -> 1088K,可以知道,在第 21 行创建的,大小为 1M 的数组被 GC 回收了。在第 22 行创建的,大小也为 1M 的数组由于 bytes 引用变量还在引用它,因此,它暂时未被 GC 回收。


第 23 行触发的 Full GC 收集分析:


在 Minor GC 的时候,信息显示 PSYoungGen : 4045K -> 1088K,Full GC 中显示的 PSYoungGen : 1088K -> 0K,以及 PSOldGen: 470K -> 1494K,可以知道,新生代 ( YoungGen ) 中存活的对象又提前进入老年代了。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
20天前
|
存储 Java 测试技术
滚雪球学Java(18):解密JavaSE中的堆栈:你真的了解Java内存吗?
【4月更文挑战第7天】🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
43 1
滚雪球学Java(18):解密JavaSE中的堆栈:你真的了解Java内存吗?
|
1月前
|
存储 Java 编译器
Java内存区域详解
Java内存区域详解
31 0
Java内存区域详解
|
1月前
|
存储 缓存 Java
优化Java代码中的内存使用:使用WeakHashMap解决内存泄漏问题
在Java应用程序中,内存泄漏是一个常见的问题,尤其是在处理大量对象时。本文将介绍如何使用WeakHashMap数据结构来解决内存泄漏问题,通过示例代码演示其在实际项目中的应用,从而提高Java代码的性能和可靠性。
|
12天前
|
存储 Java
深入理解Java虚拟机:JVM内存模型
【4月更文挑战第30天】本文将详细解析Java虚拟机(JVM)的内存模型,包括堆、栈、方法区等部分,并探讨它们在Java程序运行过程中的作用。通过对JVM内存模型的深入理解,可以帮助我们更好地编写高效的Java代码,避免内存溢出等问题。
|
15天前
|
算法 Java Go
Go vs Java:内存管理与垃圾回收机制对比
对比了Go和Java的内存管理与垃圾回收机制。Java依赖JVM自动管理内存,使用堆栈内存并采用多种垃圾回收算法,如标记-清除和分代收集。Go则提供更多的手动控制,内存分配与释放由分配器和垃圾回收器协同完成,使用三色标记算法并发回收。示例展示了Java中对象自动创建和销毁,而Go中开发者需注意内存泄漏。选择语言应根据项目需求和技术栈来决定。
|
4天前
|
存储 算法 Java
了解Java内存管理与垃圾回收机制
了解Java内存管理与垃圾回收机制
7 0
|
5天前
|
存储 Arthas 监控
JVM工作原理与实战(三十):堆内存状况的对比分析
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了堆内存状况的对比分析、产生内存溢出的原因等内容。
12 0
|
10天前
3.默认值不一样【重点】 局部变量:没有默认值,如果要想使用,必须手动进行赋值 成员变量:如果没有赋值,会有默认值,规则和数组一样 4.内存的位置不一样(了解) 局部变量:位于栈内存 成员变量:位于堆内存 5生命周期不一样(了解)
3.默认值不一样【重点】 局部变量:没有默认值,如果要想使用,必须手动进行赋值 成员变量:如果没有赋值,会有默认值,规则和数组一样 4.内存的位置不一样(了解) 局部变量:位于栈内存 成员变量:位于堆内存 5生命周期不一样(了解)
17 0
|
13天前
|
存储 机器学习/深度学习 Java
【Java探索之旅】数组使用 初探JVM内存布局
【Java探索之旅】数组使用 初探JVM内存布局
26 0
|
16天前
|
Java 开发者
【JAVA】Java内存模型中的happen-before
Happen-before关系帮助开发者理解多线程程序中操作的执行顺序和可见性,从而避免竞态条件和数据不一致性问题。它提供了一种可预测的规则来确保线程之间的正确交互。
23 0