JVM内存管理、直接内存和垃圾回收

简介: 无论对于Java程序员还是大数据研发人员,JVM是必须掌握的技能之一。既是面试中经常问的问题,也是在实际业务中对程序进行调优、排查类似于内存溢出、栈溢出、内存泄漏等问题的关键

无论对于Java程序员还是大数据研发人员,JVM是必须掌握的技能之一。既是面试中经常问的问题,也是在实际业务中对程序进行调优、排查类似于内存溢出、栈溢出、内存泄漏等问题的关键。

笔者将按下图分多篇文章详细阐述JVM:
1.jpg

本篇文章主要叙述JVM内存管理、直接内存、垃圾回收和常见的垃圾回收算法:

运行时数据区域

JVM在执行一些基于JVM运行的程序,典型的如Java程序、Scala程序时,会把它所管理的内存划分为多个不同的数据区域。这些区域有各个的作用、创建和销毁时间,有的区域生命周期依赖于用户线程的启动和结束,有些区域则随着虚拟机的启动而存在,下图展示了JVM在运行时的数据区域划分:

2.jpg

1. 方法区

方法区是各个线程共享的内存区域,主要用于存放一些"自始至终都不会变化"的东西,比如final定义的常量、类的信息(class实例)、静态变量等、方法信息。因为这些东西一旦被加载,是几乎不会被GC的,所以方法区又被称为永久代(注意一点,二者本质并不等价)。

方法区有一部分叫常量池,用于存储编译期生成的一些字面变量、符号引用以及一些运行时产生的常量(如String常量池)。方法区中的静态区用于存放类变量、静态块等。

方法区又称非堆,是有大小限制的,如果方法区使用内存超过了分配的大小,就会报类似OutOfMemory: PermGen Space的错误。

2. Java虚拟机栈

Java 虚拟机栈是线程私有的,它的生命周期与线程相同,为虚拟机执行Java方法即字节码服务,是描述Java方法执行时的内存模型。

每个方法执行时都会创建一个栈帧用于存储局部变量表(比如编译期可知的基本数据类型、对象引用等)、操作栈、动态链接、方法出口等信息。每一个方法被调用至执行完成的过程,对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

如果线程请求的栈深度大于虚拟机所允许的深度,将会报StackOverFlowError;如果虚拟机栈无法申请到足够的内存时会报OutOfMemoryError。

调整虚拟机栈大小的方式:-Xss。

3. 本地方法栈

本地方法栈为使用的到Native方法服务,本地方法接口都会使用某种本地方法栈。

当线程调用Java方法时,虚拟机会创建一个新的栈帧并压入Java栈。然而,当它调用的是本地方法时,虚拟机会保持Java栈不变,不会在线程的Java栈中压入新的栈帧,而是动态连接并直接调用指定的本地方法。

4. 堆

堆是JVM管理内存中最大的一块区域,由Java线程共享,主要用来存储new出来的对象和数组,并且这块区域随着虚拟机的启动而创建。堆可以处于逻辑上连续但物理上不连续的内存空间中。

堆是垃圾回收器管理的主要区域,可以细分为新生代和老年代,新生代又划分为eden区,from survivor区、to survivor区。

对象在被创建时,首先在新生代进行分配,eden区存放新生成的对象,两个survivor区用来存放新生代中每次垃圾回收后依然存活下来的对象。但是当创建新创建的对象非常大,该对象会直接进入老年代。

3.png

5. 程序计数器

程序计数器是线程私有的即每个线程都会有自己的程序计数器,用来记录线程执行的字节码位置,是一个没有OOM的区域。

直接内存

直接内存(direct memory)不属于JVM运行时数据区的一部分,属于堆外内存,会被频繁使用,因此在设置各个内存范围时要留出一部分物理内存,否则也容易抛出OutOfMemoryError。

垃圾收集

垃圾收集即GC,是JVM进行内存回收的处理过程。

开发人员更多的是关注业务需求的实现,而内存管理是交由JVM完成的,如果不进行或者错误的进行垃圾回收会导致程序不稳定甚至崩溃。Java提供的GC功能可以自动监测对象是否超过作用域等从而达到自动回收内存的目的,可以有效防止内存泄露,有效的使用可用内存。

GC主要分为3种:minor GC、major GC和full GC。
minor GC是发生在新生代的,minor GC是发生在老年代的。对于full GC出发的原因则比较多,比如老年代空间不足,它会出发stop world,处理不好往往会影响整个程序的稳定性严重会导致系统不可用,需要特别注意。

常见的垃圾回收算法

1. 标记清除算法

首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

存在如下两个缺点:

1.效率低

需要先对要回收的对象进行标记,然后再统一清除,然而标记和清除两个过程效率都很低下。

2.内存碎片问题

标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作,影响性能。

2. 复制算法

先将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当使用的这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。

优点:这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

缺点:不适合对象存活率较高的场景,因为这种场景要进行较多的复制操作影响效率;实际可用内存变为分配内存的一半,因为每次只使用其中的一半内存。

3. 标记整理算法

先标记(标记过程与标记清除算法一样),让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。这样可以解决内存碎片问题。

4. 分代收集算法

就是针对Java堆内存中新生代、老年代等采用不同的垃圾回收算法。如在新生代中,往往只有少量对象存活(最后会进入老年代),则适合用复制算法。而老年代中对象存活率较高,没有额外的空间对它进行分配担保,就使用标记清除算法。

当然实际应用中,使用什么算法,要看使用的垃圾回收器

相关文章
|
13天前
|
JavaScript 前端开发 Java
垃圾回收机制会导致内存泄漏吗?
【10月更文挑战第29天】虽然JavaScript的垃圾回收机制本身是为了有效地管理内存,但开发者在编写代码时需要注意上述这些可能导致内存泄漏的情况,遵循良好的编程习惯,及时释放不再使用的资源,以确保程序能够高效地利用内存资源,避免出现内存泄漏问题。
|
7天前
|
Arthas 监控 Java
JVM进阶调优系列(9)大厂面试官:内存溢出几种?能否现场演示一下?| 面试就那点事
本文介绍了JVM内存溢出(OOM)的四种类型:堆内存、栈内存、元数据区和直接内存溢出。每种类型通过示例代码演示了如何触发OOM,并分析了其原因。文章还提供了如何使用JVM命令工具(如jmap、jhat、GCeasy、Arthas等)分析和定位内存溢出问题的方法。最后,强调了合理设置JVM参数和及时回收内存的重要性。
|
9天前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
30 6
|
5天前
|
Java Linux Windows
JVM内存
首先JVM内存限制于实际的最大物理内存,假设物理内存无限大的话,JVM内存的最大值跟操作系统有很大的关系。简单的说就32位处理器虽然可控内存空间有4GB,但是具体的操作系统会给一个限制,这个限制一般是2GB-3GB(一般来说Windows系统下为1.5G-2G,Linux系统下为2G-3G),而64bit以上的处理器就不会有限制。
8 1
|
24天前
|
存储 算法 Java
聊聊jvm的内存结构, 以及各种结构的作用
【10月更文挑战第27天】JVM(Java虚拟机)的内存结构主要包括程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区和运行时常量池。各部分协同工作,为Java程序提供高效稳定的内存管理和运行环境,确保程序的正常执行、数据存储和资源利用。
46 10
|
23天前
|
存储 算法 Java
Java虚拟机(JVM)的内存管理与性能优化
本文深入探讨了Java虚拟机(JVM)的内存管理机制,包括堆、栈、方法区等关键区域的功能与作用。通过分析垃圾回收算法和调优策略,旨在帮助开发者理解如何有效提升Java应用的性能。文章采用通俗易懂的语言,结合具体实例,使读者能够轻松掌握复杂的内存管理概念,并应用于实际开发中。
|
30天前
|
存储 监控 算法
Java中的内存管理与垃圾回收机制解析
本文深入探讨了Java编程语言中的内存管理方式,特别是垃圾回收机制。我们将了解Java的自动内存管理是如何工作的,它如何帮助开发者避免常见的内存泄漏问题。通过分析不同垃圾回收算法(如标记-清除、复制和标记-整理)以及JVM如何选择合适的垃圾回收策略,本文旨在帮助Java开发者更好地理解和优化应用程序的性能。
|
3月前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
370 0
|
22天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
46 1
|
27天前
|
存储
共用体在内存中如何存储数据
共用体(Union)在内存中为所有成员分配同一段内存空间,大小等于最大成员所需的空间。这意味着所有成员共享同一块内存,但同一时间只能存储其中一个成员的数据,无法同时保存多个成员的值。