JVM内存管理、直接内存和垃圾回收

简介: 无论对于Java程序员还是大数据研发人员,JVM是必须掌握的技能之一。既是面试中经常问的问题,也是在实际业务中对程序进行调优、排查类似于内存溢出、栈溢出、内存泄漏等问题的关键

无论对于Java程序员还是大数据研发人员,JVM是必须掌握的技能之一。既是面试中经常问的问题,也是在实际业务中对程序进行调优、排查类似于内存溢出、栈溢出、内存泄漏等问题的关键。

笔者将按下图分多篇文章详细阐述JVM:
1.jpg

本篇文章主要叙述JVM内存管理、直接内存、垃圾回收和常见的垃圾回收算法:

运行时数据区域

JVM在执行一些基于JVM运行的程序,典型的如Java程序、Scala程序时,会把它所管理的内存划分为多个不同的数据区域。这些区域有各个的作用、创建和销毁时间,有的区域生命周期依赖于用户线程的启动和结束,有些区域则随着虚拟机的启动而存在,下图展示了JVM在运行时的数据区域划分:

2.jpg

1. 方法区

方法区是各个线程共享的内存区域,主要用于存放一些"自始至终都不会变化"的东西,比如final定义的常量、类的信息(class实例)、静态变量等、方法信息。因为这些东西一旦被加载,是几乎不会被GC的,所以方法区又被称为永久代(注意一点,二者本质并不等价)。

方法区有一部分叫常量池,用于存储编译期生成的一些字面变量、符号引用以及一些运行时产生的常量(如String常量池)。方法区中的静态区用于存放类变量、静态块等。

方法区又称非堆,是有大小限制的,如果方法区使用内存超过了分配的大小,就会报类似OutOfMemory: PermGen Space的错误。

2. Java虚拟机栈

Java 虚拟机栈是线程私有的,它的生命周期与线程相同,为虚拟机执行Java方法即字节码服务,是描述Java方法执行时的内存模型。

每个方法执行时都会创建一个栈帧用于存储局部变量表(比如编译期可知的基本数据类型、对象引用等)、操作栈、动态链接、方法出口等信息。每一个方法被调用至执行完成的过程,对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

如果线程请求的栈深度大于虚拟机所允许的深度,将会报StackOverFlowError;如果虚拟机栈无法申请到足够的内存时会报OutOfMemoryError。

调整虚拟机栈大小的方式:-Xss。

3. 本地方法栈

本地方法栈为使用的到Native方法服务,本地方法接口都会使用某种本地方法栈。

当线程调用Java方法时,虚拟机会创建一个新的栈帧并压入Java栈。然而,当它调用的是本地方法时,虚拟机会保持Java栈不变,不会在线程的Java栈中压入新的栈帧,而是动态连接并直接调用指定的本地方法。

4. 堆

堆是JVM管理内存中最大的一块区域,由Java线程共享,主要用来存储new出来的对象和数组,并且这块区域随着虚拟机的启动而创建。堆可以处于逻辑上连续但物理上不连续的内存空间中。

堆是垃圾回收器管理的主要区域,可以细分为新生代和老年代,新生代又划分为eden区,from survivor区、to survivor区。

对象在被创建时,首先在新生代进行分配,eden区存放新生成的对象,两个survivor区用来存放新生代中每次垃圾回收后依然存活下来的对象。但是当创建新创建的对象非常大,该对象会直接进入老年代。

3.png

5. 程序计数器

程序计数器是线程私有的即每个线程都会有自己的程序计数器,用来记录线程执行的字节码位置,是一个没有OOM的区域。

直接内存

直接内存(direct memory)不属于JVM运行时数据区的一部分,属于堆外内存,会被频繁使用,因此在设置各个内存范围时要留出一部分物理内存,否则也容易抛出OutOfMemoryError。

垃圾收集

垃圾收集即GC,是JVM进行内存回收的处理过程。

开发人员更多的是关注业务需求的实现,而内存管理是交由JVM完成的,如果不进行或者错误的进行垃圾回收会导致程序不稳定甚至崩溃。Java提供的GC功能可以自动监测对象是否超过作用域等从而达到自动回收内存的目的,可以有效防止内存泄露,有效的使用可用内存。

GC主要分为3种:minor GC、major GC和full GC。
minor GC是发生在新生代的,minor GC是发生在老年代的。对于full GC出发的原因则比较多,比如老年代空间不足,它会出发stop world,处理不好往往会影响整个程序的稳定性严重会导致系统不可用,需要特别注意。

常见的垃圾回收算法

1. 标记清除算法

首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

存在如下两个缺点:

1.效率低

需要先对要回收的对象进行标记,然后再统一清除,然而标记和清除两个过程效率都很低下。

2.内存碎片问题

标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作,影响性能。

2. 复制算法

先将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当使用的这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。

优点:这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

缺点:不适合对象存活率较高的场景,因为这种场景要进行较多的复制操作影响效率;实际可用内存变为分配内存的一半,因为每次只使用其中的一半内存。

3. 标记整理算法

先标记(标记过程与标记清除算法一样),让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。这样可以解决内存碎片问题。

4. 分代收集算法

就是针对Java堆内存中新生代、老年代等采用不同的垃圾回收算法。如在新生代中,往往只有少量对象存活(最后会进入老年代),则适合用复制算法。而老年代中对象存活率较高,没有额外的空间对它进行分配担保,就使用标记清除算法。

当然实际应用中,使用什么算法,要看使用的垃圾回收器

相关文章
|
17天前
|
存储 缓存 算法
JVM简介—1.Java内存区域
本文详细介绍了Java虚拟机运行时数据区的各个方面,包括其定义、类型(如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区和直接内存)及其作用。文中还探讨了各版本内存区域的变化、直接内存的使用、从线程角度分析Java内存区域、堆与栈的区别、对象创建步骤、对象内存布局及访问定位,并通过实例说明了常见内存溢出问题的原因和表现形式。这些内容帮助开发者深入理解Java内存管理机制,优化应用程序性能并解决潜在的内存问题。
114 29
JVM简介—1.Java内存区域
|
2月前
|
存储 设计模式 监控
快速定位并优化CPU 与 JVM 内存性能瓶颈
本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。
670 166
|
13天前
|
缓存 算法 Java
JVM实战—4.JVM垃圾回收器的原理和调优
本文详细探讨了JVM垃圾回收机制,包括新生代ParNew和老年代CMS垃圾回收器的工作原理与优化方法。内容涵盖ParNew的多线程特性、默认线程数设置及适用场景,CMS的四个阶段(初始标记、并发标记、重新标记、并发清理)及其性能分析,以及如何通过合理分配内存区域、调整参数(如-XX:SurvivorRatio、-XX:MaxTenuringThreshold等)来优化垃圾回收。此外,还结合电商大促案例,分析了系统高峰期的内存使用模型,并总结了YGC和FGC的触发条件与优化策略。最后,针对常见问题进行了汇总解答,强调了基于系统运行模型进行JVM参数调优的重要性。
JVM实战—4.JVM垃圾回收器的原理和调优
|
14天前
|
消息中间件 Java 应用服务中间件
JVM实战—2.JVM内存设置与对象分配流转
本文详细介绍了JVM内存管理的相关知识,包括:JVM内存划分原理、对象分配与流转、线上系统JVM内存设置、JVM参数优化、问题汇总。
JVM实战—2.JVM内存设置与对象分配流转
|
16天前
|
缓存 监控 算法
JVM简介—2.垃圾回收器和内存分配策略
本文介绍了Java垃圾回收机制的多个方面,包括垃圾回收概述、对象存活判断、引用类型介绍、垃圾收集算法、垃圾收集器设计、具体垃圾回收器详情、Stop The World现象、内存分配与回收策略、新生代配置演示、内存泄漏和溢出问题以及JDK提供的相关工具。
JVM简介—2.垃圾回收器和内存分配策略
|
14天前
|
消息中间件 存储 算法
JVM实战—3.JVM垃圾回收的算法和全流程
本文详细介绍了JVM内存管理与垃圾回收机制,涵盖以下内容:对象何时被垃圾回收、垃圾回收算法及其优劣、新生代和老年代的垃圾回收算法、Stop the World问题分析、核心流程梳理。
JVM实战—3.JVM垃圾回收的算法和全流程
|
24天前
|
存储 设计模式 监控
如何快速定位并优化CPU 与 JVM 内存性能瓶颈?
如何快速定位并优化CPU 与 JVM 内存性能瓶颈?
|
1月前
|
存储 算法 Java
JVM: 内存、类与垃圾
分代收集算法将内存分为新生代和老年代,分别使用不同的垃圾回收算法。新生代对象使用复制算法,老年代对象使用标记-清除或标记-整理算法。
27 6
|
13天前
|
消息中间件 算法 Java
JVM实战—5.G1垃圾回收器的原理和调优
本文详细解析了G1垃圾回收器的工作原理及其优化方法。首先介绍了G1通过将堆内存划分为多个Region实现分代回收,有效减少停顿时间,并可通过参数设置控制GC停顿时长。接着分析了G1相较于传统GC的优势,如停顿时间可控、大对象不进入老年代等。还探讨了如何合理设置G1参数以优化性能,包括调整新生代与老年代比例、控制GC频率及避免Full GC。最后结合实际案例说明了G1在大内存场景和对延迟敏感业务中的应用价值,同时解答了关于内存碎片、Region划分对性能影响等问题。
|
4月前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
867 1