JVM内存管理、直接内存和垃圾回收

简介: 无论对于Java程序员还是大数据研发人员,JVM是必须掌握的技能之一。既是面试中经常问的问题,也是在实际业务中对程序进行调优、排查类似于内存溢出、栈溢出、内存泄漏等问题的关键

无论对于Java程序员还是大数据研发人员,JVM是必须掌握的技能之一。既是面试中经常问的问题,也是在实际业务中对程序进行调优、排查类似于内存溢出、栈溢出、内存泄漏等问题的关键。

笔者将按下图分多篇文章详细阐述JVM:
1.jpg

本篇文章主要叙述JVM内存管理、直接内存、垃圾回收和常见的垃圾回收算法:

运行时数据区域

JVM在执行一些基于JVM运行的程序,典型的如Java程序、Scala程序时,会把它所管理的内存划分为多个不同的数据区域。这些区域有各个的作用、创建和销毁时间,有的区域生命周期依赖于用户线程的启动和结束,有些区域则随着虚拟机的启动而存在,下图展示了JVM在运行时的数据区域划分:

2.jpg

1. 方法区

方法区是各个线程共享的内存区域,主要用于存放一些"自始至终都不会变化"的东西,比如final定义的常量、类的信息(class实例)、静态变量等、方法信息。因为这些东西一旦被加载,是几乎不会被GC的,所以方法区又被称为永久代(注意一点,二者本质并不等价)。

方法区有一部分叫常量池,用于存储编译期生成的一些字面变量、符号引用以及一些运行时产生的常量(如String常量池)。方法区中的静态区用于存放类变量、静态块等。

方法区又称非堆,是有大小限制的,如果方法区使用内存超过了分配的大小,就会报类似OutOfMemory: PermGen Space的错误。

2. Java虚拟机栈

Java 虚拟机栈是线程私有的,它的生命周期与线程相同,为虚拟机执行Java方法即字节码服务,是描述Java方法执行时的内存模型。

每个方法执行时都会创建一个栈帧用于存储局部变量表(比如编译期可知的基本数据类型、对象引用等)、操作栈、动态链接、方法出口等信息。每一个方法被调用至执行完成的过程,对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

如果线程请求的栈深度大于虚拟机所允许的深度,将会报StackOverFlowError;如果虚拟机栈无法申请到足够的内存时会报OutOfMemoryError。

调整虚拟机栈大小的方式:-Xss。

3. 本地方法栈

本地方法栈为使用的到Native方法服务,本地方法接口都会使用某种本地方法栈。

当线程调用Java方法时,虚拟机会创建一个新的栈帧并压入Java栈。然而,当它调用的是本地方法时,虚拟机会保持Java栈不变,不会在线程的Java栈中压入新的栈帧,而是动态连接并直接调用指定的本地方法。

4. 堆

堆是JVM管理内存中最大的一块区域,由Java线程共享,主要用来存储new出来的对象和数组,并且这块区域随着虚拟机的启动而创建。堆可以处于逻辑上连续但物理上不连续的内存空间中。

堆是垃圾回收器管理的主要区域,可以细分为新生代和老年代,新生代又划分为eden区,from survivor区、to survivor区。

对象在被创建时,首先在新生代进行分配,eden区存放新生成的对象,两个survivor区用来存放新生代中每次垃圾回收后依然存活下来的对象。但是当创建新创建的对象非常大,该对象会直接进入老年代。

3.png

5. 程序计数器

程序计数器是线程私有的即每个线程都会有自己的程序计数器,用来记录线程执行的字节码位置,是一个没有OOM的区域。

直接内存

直接内存(direct memory)不属于JVM运行时数据区的一部分,属于堆外内存,会被频繁使用,因此在设置各个内存范围时要留出一部分物理内存,否则也容易抛出OutOfMemoryError。

垃圾收集

垃圾收集即GC,是JVM进行内存回收的处理过程。

开发人员更多的是关注业务需求的实现,而内存管理是交由JVM完成的,如果不进行或者错误的进行垃圾回收会导致程序不稳定甚至崩溃。Java提供的GC功能可以自动监测对象是否超过作用域等从而达到自动回收内存的目的,可以有效防止内存泄露,有效的使用可用内存。

GC主要分为3种:minor GC、major GC和full GC。
minor GC是发生在新生代的,minor GC是发生在老年代的。对于full GC出发的原因则比较多,比如老年代空间不足,它会出发stop world,处理不好往往会影响整个程序的稳定性严重会导致系统不可用,需要特别注意。

常见的垃圾回收算法

1. 标记清除算法

首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

存在如下两个缺点:

1.效率低

需要先对要回收的对象进行标记,然后再统一清除,然而标记和清除两个过程效率都很低下。

2.内存碎片问题

标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作,影响性能。

2. 复制算法

先将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当使用的这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。

优点:这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

缺点:不适合对象存活率较高的场景,因为这种场景要进行较多的复制操作影响效率;实际可用内存变为分配内存的一半,因为每次只使用其中的一半内存。

3. 标记整理算法

先标记(标记过程与标记清除算法一样),让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。这样可以解决内存碎片问题。

4. 分代收集算法

就是针对Java堆内存中新生代、老年代等采用不同的垃圾回收算法。如在新生代中,往往只有少量对象存活(最后会进入老年代),则适合用复制算法。而老年代中对象存活率较高,没有额外的空间对它进行分配担保,就使用标记清除算法。

当然实际应用中,使用什么算法,要看使用的垃圾回收器

相关文章
|
1月前
|
监控 算法 Java
Java虚拟机(JVM)垃圾回收机制深度剖析与优化策略####
本文作为一篇技术性文章,深入探讨了Java虚拟机(JVM)中垃圾回收的工作原理,详细分析了标记-清除、复制算法、标记-压缩及分代收集等主流垃圾回收算法的特点和适用场景。通过实际案例,展示了不同GC(Garbage Collector)算法在应用中的表现差异,并针对大型应用提出了一系列优化策略,包括选择合适的GC算法、调整堆内存大小、并行与并发GC调优等,旨在帮助开发者更好地理解和优化Java应用的性能。 ####
42 0
|
12天前
|
存储 Java 程序员
【JVM】——JVM运行机制、类加载机制、内存划分
JVM运行机制,堆栈,程序计数器,元数据区,JVM加载机制,双亲委派模型
|
12天前
|
算法 网络协议 Java
【JVM】——GC垃圾回收机制(图解通俗易懂)
GC垃圾回收,标识出垃圾(计数机制、可达性分析)内存释放机制(标记清除、复制算法、标记整理、分代回收)
|
1月前
|
存储 监控 算法
Java内存管理深度剖析:从垃圾收集到内存泄漏的全面指南####
本文深入探讨了Java虚拟机(JVM)中的内存管理机制,特别是垃圾收集(GC)的工作原理及其调优策略。不同于传统的摘要概述,本文将通过实际案例分析,揭示内存泄漏的根源与预防措施,为开发者提供实战中的优化建议,旨在帮助读者构建高效、稳定的Java应用。 ####
40 8
|
1月前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
1月前
|
缓存 监控 算法
Python内存管理:掌握对象的生命周期与垃圾回收机制####
本文深入探讨了Python中的内存管理机制,特别是对象的生命周期和垃圾回收过程。通过理解引用计数、标记-清除及分代收集等核心概念,帮助开发者优化程序性能,避免内存泄漏。 ####
47 3
|
1月前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####
|
2月前
|
机器学习/深度学习 监控 算法
Java虚拟机(JVM)的垃圾回收机制深度剖析####
本文深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法、性能调优策略及未来趋势。通过实例解析,为开发者提供优化Java应用性能的思路与方法。 ####
57 1
|
2月前
|
算法 Java 开发者
Java内存管理与垃圾回收机制深度剖析####
本文深入探讨了Java虚拟机(JVM)的内存管理机制,特别是其垃圾回收机制的工作原理、算法及实践优化策略。不同于传统的摘要概述,本文将以一个虚拟的“城市环卫系统”为比喻,生动形象地揭示Java内存管理的奥秘,旨在帮助开发者更好地理解并调优Java应用的性能。 ####
|
2月前
|
Java
JVM内存参数
-Xmx[]:堆空间最大内存 -Xms[]:堆空间最小内存,一般设置成跟堆空间最大内存一样的 -Xmn[]:新生代的最大内存 -xx[use 垃圾回收器名称]:指定垃圾回收器 -xss:设置单个线程栈大小 一般设堆空间为最大可用物理地址的百分之80