深入理解JVM - 对象分配内存

简介: ​ 这一节我们来讨论对象分配内存的细节,这一块的内容相对比较简单,但是也是比较重要的内容,最后会总结书里面的OOM的溢出案例,在过去的文章已经讲到过不少类似的情况。

前言


这一节我们来讨论对象分配内存的细节,这一块的内容相对比较简单,但是也是比较重要的内容,最后会总结书里面的OOM的溢出案例,在过去的文章已经讲到过不少类似的情况。


思维导图:


地址www.mubucm.com/doc/6nFUcbE…


image.png


概述


  1. 讲述对象分配内存的方式:“指针碰撞”和“空闲列表”的实现方式
  2. 对象分配中使用了哪些方法,当出现并发分配使用什么方式进行处理的。
  3. 对象的访问方式有哪些,访问的过程的优劣对比
  4. 对象在内存当中的布局,分为三个大类,需要重点掌握对象头的部分
  5. 实战OOM的内容,这部分适合实战的时候再看。


对象的创建


对象什么时候会创建的,虽然很多情况下我们会声明比如public static final然而实际上这些公开常量不使用的时候其实并不会占用内存,只有在 真正被使用的情况下才会通过类加载器加载进内存空间。这里需要注意一个非常重要的点就是,对象一旦被创建就可以确定对象占用的内存大小,这一步在类加载器的阶段会完成,至于类加载器的具体细节,将会在后续的文章进行讲述。


对象创建的过程可以简述为:检查是否在常量池当中找到引用,如果没有引用,执行类加载的过程。


image.png


分配方式


既然知道了对象的创建,那么此时我们需要了解对象是如何分配的,一般情况下有两种主流的方案:“指针碰撞”和“空闲列表”。


指针碰撞:假设堆内存是绝对的规整的(前提),把所有使用过的内存放到一遍,把没有使用过多内存放在另一边,中间放着一个指针作为指示器,如果出现内存分配,则将分界线往空闲的那一边挪动即可。简单的画图理解如下:


image.png


空闲列表:如果内存不是规整而是交错的情况下使用这一种算法,如果内存不是规整的这时候虚拟机需要维护一个空闲列表记录那些空间是可用的,在对象分配的时候需要找到一块足够大的空间进行使用,然而如果没有足够大的空间,这时候就需要使用垃圾收集器进行收集之后,在根据内存的实际情况采用指针碰撞还是空闲列表。


如何判断用哪种算法?


这两个对象分配的算法由堆决定是否规整决定是否使用,但是堆是否规则又和垃圾收集器有关,如果垃圾收集器没有使用标记整理这种算法,通常情况下使用空闲列表,而如果使用了,毫无疑问此时的内存空间是十分规整的,从而会使用指针碰撞的算法。


另外,指针碰撞的效率明显是要比空闲列表的算法要高不少。


并发分配的处理办法


这里还有一个问题,如果此时出现两个对象并发进行创建的时候,出现的使用同一块内存进行分配的情况,这种情况下JVM又有两种处理方式: 分配内存空间的动作进行同步处理(意思就是说吧整个分配过程同步),改进的方式是使用CAS加上失败重试的机制保证更新操作的原子性


除此之外,还有一种方法是在分配对象是在不同的线程空间中进行的,每一个线程在JAVA堆当中分配一小块内存(可以理解为线程的专属空间),这一块内存也叫做“本地线程缓冲”,那个线程需要内存就分配到哪一个线程缓冲**(TLAB)**,只有本地线程缓冲用完了,才需要使用同步锁锁住。


提示:JVM通过使用 -XX:+/-UseTLAB 决定是否开启


毫无疑问,JVM同时使用了这两种方式,大致的方式是在本地线程缓冲池足够的时候,会使用第二种方式,但是一旦TLAB用完,就会采用CAS锁失败重试锁进行对象的分配,这样可以最大限度的减少线程停顿和等待的时间。


访问方式


了解了对象是如何分配的,这里肯定也会想知道栈是如何访问堆上的内存的,最简单的理解是在栈上分配一个引用,这个引用本质上是一个 指针,在JAVA当中叫做使用栈上的reference 操作堆上的数据,这个指针指向堆空间对象引用的地址,这样我们可以操作栈上的引用就可以操作堆内存的空间。最后,对象的访问方式由虚拟机决定


访问方式的实现


访问方式的实现由两种方式:句柄访问和直接访问。下面来分别访问一下这两种方式的差别。


句柄访问:句柄访问的方式会在堆中划分一块内存作为句柄池,引用中存储的是句柄的地址,句柄中包含了对象的实例数据和类型数据等等具体信息的地址。注意这里是实例数据的地址而不是实例数据哦,用画图表示如下:


image.png


直接指针:更为简单好理解,栈上引用指向的就是对象实例数据的地址,访问对象不需要一次间接访问的开销。

image.png


优劣对比


句柄:


  • 垃圾清理之后,只需要改变实例指针的数据不需要改变reference。


直接指针:


  • 必须考虑对象实例数据的存放问题(设计)


  • 可以减少一次指针访问的内存开销同时减少指针定位的开销


我们知道了对象是如何访问的,现在我们再来看下,对象创建之后的内部结构如何。


对象在内存当中布局


对象的存储布局可以分为三个部分:对象头、实例数据、对齐填充。


对象头:


对象头分为两类:第一类是存储自身的运行时候的数据(MarkWord),第二类是类型指针,下面来分贝说明:


第一类存储的是对象运行时候的数据,包含内容有 哈希码、GC分代年龄、锁状态标志,线程持有锁等等内容,这一块内存在设计上根据不同虚拟机的位数分别占用32位和64位的空间大小,官方称这一块空间为“MarkWord”。注意Markword使用的是动态定义的数据结构,方便在极小的空间存储尽可能多的内容。


Markword的分布内容:


假设在32位的虚拟机当中,对象未被同步锁定的状态下,他的结构如下,这里需要注意的是对象分代年龄这一个面试考点:


image.png


第二类则是类型指针,通过类型指针类确定他的实例数据是哪一个类的实例,如果是数组的结构,还需要额外维护一块内容来标记数组的长度。到了这里我们暂停一下,在之前文章当中他提到过,我们分配字节数组的大小实际上JVM会耗费更多的内存空间进行存储,这里的的对象头就是消耗了一部分。


实例数据


第二部分是实例数据的部分,这个部分才是真正的存储数据的地方,保存了我们在程序代码里面定义的各种字段内容。


另外,虚拟机的默认分配顺序为:


  • 基础类型:longs/double 向下分配
  • 对象最后分配


对象补齐


最后一部分是对象填充的内容,基本没有多少含义,仅仅作为补齐占位符使用,同时为了保证对象的对齐标准,对象必须是8的整数倍


提示:这里有个问题,为什么Hotspot的虚拟机起始字节是8的整数倍?


因为对象头被设计为刚好是8个倍数,这样就不需要对齐补齐,但是一旦不够会根据8的次方进行补齐的操作。


实战OOM


其实这部分已经在之前的文章已经提到过了,这些内容适合自己解决JVM问题的时候翻一翻,简单做一下笔记即可。


1. java堆溢出
    实例参数
        -Xmas 20m
        -xmx 20m
        -xx+HeapDumpOnOutOfMemoryError
    异常
        java heap dump
    处理方式
        如果是内存泄漏,gcroot,引用链上看对应gc的异常链信息
        检查(-xmx 与 -xmx)设置
            看参数设置
            对象生命周期过长,持有状态过长
    排查工具
        eclipse:eclipse memory analyze
2. 本地方法栈溢出
    ⚠️hotspot 本质上不区分虚拟机栈与本地方法栈。同时hotspot 不支持动态扩展。
    问题
        本地方法栈不支持动态扩展出现oom
        如何确定栈的最小值
            操作系统的内存分页大小决定
    异常
        无法容纳新的栈帧。导致soe异常
    如何验证
        使用-Xss 减少栈内存空间
        定义大量本地变量。增大方法帧中的变量表长度
        some个人实验
            stack length 981
            定义大量的栈帧(变量)
    结论
        无论是栈帧太大还是虚拟机太小,新的栈帧内存无法分配时候,soe异常
        java堆与方法区最大值计算
            单进程最大内存限制位2gb
                最大堆容量
                方法区容量
                程序计数器
                虚拟机消耗
                直接内存
            栈帧空间越大,越容易耗尽内存
3. 方法区和运行时常量池溢出
    发展历史
        Jdk6
            -xx:perm size 和 -xx:bumper size 限制永久代大小
                溢出结果:Permgen space
        Jdk7
            由于永久代放到堆上,所以出现引用一致
        jdk8
            和jdk7一致
            jdk8防止创建新类型做一些预防
                -xx: maxMetaSpaceSize: 元空间最大值默认为-1
                -xx: metaspacesize: 元空间初始大小
                -xx minMetaSpaceFreeRatio:垃圾收集后最小元空间乘百分比
    案例
        为什么java会出现两个false
            a这个字符在intern当中并不是首次遇到
        如何让方法区溢出
            Jdk8元空间与堆共享方法区,不再那么容易溢出
            jdk7可以用大量代理对象出现方法区溢出
4. 本地直接内存溢出
     异常情况
        Oom异常:和普通的oom情况不一样
            如果dump出来的文件很小,程序间接或者直接使用nio可以考虑直接内存原因
    默认是Ljava 堆最大值[ -xmx 一致]
        用-xx: maxDirectMemorySize 指定直接内存如何溢出
            使用unsafe.allocateMemory 不断申请内存


总结


通过对象的创建,我们了解了对象的两种分配方式,指针碰撞和空闲列表,同时我们了解了他们在不同的垃圾收集器下使用的分配方式不同,另外我们了解了并发创建对象的问题,使用CAS以及TLAB本地缓存的方式进行处理。


接着我们了解了对象的访问方式,拥有句柄和直接访问两种方式,接着我们对比了这两者的差别,最后我们了解了对象的具体结构。


写在最后


对象分配内存这一块内容比较简单,只要掌握对象创建内容以及相关的布局重点即可。

相关文章
|
2月前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
384 1
|
12天前
|
存储 Java 程序员
【JVM】——JVM运行机制、类加载机制、内存划分
JVM运行机制,堆栈,程序计数器,元数据区,JVM加载机制,双亲委派模型
|
1月前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
1月前
|
缓存 监控 算法
Python内存管理:掌握对象的生命周期与垃圾回收机制####
本文深入探讨了Python中的内存管理机制,特别是对象的生命周期和垃圾回收过程。通过理解引用计数、标记-清除及分代收集等核心概念,帮助开发者优化程序性能,避免内存泄漏。 ####
47 3
|
14天前
|
缓存 Java
JVM对象引用
本次课程聚焦JVM对象引用,涵盖强引用、软引用、弱引用和虚引用。强引用是最常见的引用类型,确保对象不会被垃圾回收器回收,适用于需要确保对象存活的场景;软引用在内存不足时会被优先回收,常用于缓存;弱引用的对象随时可能被回收,适合临时对象;虚引用最弱,主要用于接收对象回收通知,进行资源清理。通过合理选择引用类型,可优化内存管理,避免内存泄露。
|
2月前
|
Java
JVM内存参数
-Xmx[]:堆空间最大内存 -Xms[]:堆空间最小内存,一般设置成跟堆空间最大内存一样的 -Xmn[]:新生代的最大内存 -xx[use 垃圾回收器名称]:指定垃圾回收器 -xss:设置单个线程栈大小 一般设堆空间为最大可用物理地址的百分之80
|
2月前
|
Java
JVM运行时数据区(内存结构)
1)虚拟机栈:每次调用方法都会在虚拟机栈中产生一个栈帧,每个栈帧中都有方法的参数、局部变量、方法出口等信息,方法执行完毕后释放栈帧 (2)本地方法栈:为native修饰的本地方法提供的空间,在HotSpot中与虚拟机合二为一 (3)程序计数器:保存指令执行的地址,方便线程切回后能继续执行代码
27 3
|
2月前
|
存储 缓存 监控
Elasticsearch集群JVM调优堆外内存
Elasticsearch集群JVM调优堆外内存
56 1
|
3月前
|
存储 安全 Java
jvm 锁的 膨胀过程?锁内存怎么变化的
【10月更文挑战第3天】在Java虚拟机(JVM)中,`synchronized`关键字用于实现同步,确保多个线程在访问共享资源时的一致性和线程安全。JVM对`synchronized`进行了优化,以适应不同的竞争场景,这种优化主要体现在锁的膨胀过程,即从偏向锁到轻量级锁,再到重量级锁的转变。下面我们将详细介绍这一过程以及锁在内存中的变化。
48 4
|
2月前
|
Arthas 监控 Java
JVM进阶调优系列(9)大厂面试官:内存溢出几种?能否现场演示一下?| 面试就那点事
本文介绍了JVM内存溢出(OOM)的四种类型:堆内存、栈内存、元数据区和直接内存溢出。每种类型通过示例代码演示了如何触发OOM,并分析了其原因。文章还提供了如何使用JVM命令工具(如jmap、jhat、GCeasy、Arthas等)分析和定位内存溢出问题的方法。最后,强调了合理设置JVM参数和及时回收内存的重要性。