JVM内部世界(内存划分,类加载,垃圾回收)(上)
https://developer.aliyun.com/article/1480774?spm=a2c6h.13148508.setting.14.5f4e4f0ePc4m3X
💕"Echo"💕
作者:Mylvzi
文章主要内容:JVM内部世界(内存划分,类加载,垃圾回收)
3.垃圾回收机制(GC)
在C语言中我们学习过动态内存管理这一章节,通过malloc/realloc函数申请动态的内存,通过free来释放申请的动态内存,对于动态内存来说,最需要注意的一点是要及时通过free来释放申请的内存,如果不及时释放,就有可能造成内存泄露问题
在C++里面也是,都是需要通过手动的释放申请的内存(C++中是delete方法),这种手动释放内存
的方式对于程序员来说是一个致命杀手,会常常突然出现,而且难以发现(往往是因为长时间的大量不释放内存所导致的),为了解决这种问题,最好的方法就是把释放内存这个操作交给计算机去执行
在Java中就引入了**垃圾回收机制(Garbage Collection)**来自动的完成内存的释放,可有这样的一个比喻说明C++和Java的垃圾回收机制的不同–“C++是手动挡,Java是自动挡”
GC的工作过程主要有以下两步:
- 找到垃圾
- 释放垃圾
1.找到垃圾
释放垃圾的第一步首先需要找到"垃圾",这里的垃圾就是不再使用的内存.具体找的方式大体上相同,都是需要有一组线程去不断的扫描的当前所有的对象,判断对象是否仍被引用,如果没有引用就认为是"垃圾"
不同的语言实现的方式有所差异,大概分为以下两种:
- 引用计数
- 可达性分析
1.引用计数
为new出来的出现单独创建一块内存空间,当做计数器
,描述这个对象有多少引用指向
如果引用计数为0,就代表没有引用指向,也就代表此对象成为"垃圾",可以被释放
引用计数的问题
1.需要额外占用内存空间
引用计数需要额外的内存当做计数器,计数器少说也得2个字节,如果对象本身很小,那么计数器的内存占总体的内存的比例就会很大,而且随着对象数目的增多,这种额外的内存开销就不容忽视
2.存在循环引用问题
如果两个对象分别引用,就会形成环形引用,就有可能出现永远无法释放的问题
class Test { public Test t; } Test a = new Test(); Test b = new Test(); // 在内部分别引用 a.t = b; b.t = a; // 置空 a = null; b = null;
在上述代码中,每置空之前,创建出的两个对象的引用计数都是2,分别给a,b置空,但是内部t对象仍在引用,所以创建的两个Test对象的引用变为1
此时a和b被销毁了,在代码中不可能再访问到这两个对象,但是此时这两个对象的引用计数不为0,要想释放对象1,需要先释放对象2,要想释放对象2,需要先释放对象1,构成了逻辑上的死环,这两个对象就永远无法进行释放了
2.可达性分析
Java的GC机制采用的是可达性分析,通过扫描的方式,从特定对象出发(GC Root),对扫描到的对象标记为可达
,没有扫描到的对象就认为是不可达的,需要当做垃圾进行释放
可达性分析本质上是一种使用时间换空间的方式,通过一组扫描线程,不断的对所有的对象进行扫描,且这种扫描是周期性的,遍历方式类似于树的遍历(底层很可能是N叉树)
GC Root是扫描过程的起点,通常包括以下几种类型:
- 活动线程的本地变量和输入参数
- 静态对象的引用
- 活动线程的所有类对象
2.释放垃圾
释放垃圾的方法主要有三种:
- 标记清楚
- 复制算法
- 标记整理
1.标记清除
对于标记的对象,直接释放
标记清除是一种简单粗暴的方式,垃圾在哪里,就直接释放
演示:
缺陷:
- 会导致大量内存碎片的出现.申请内存是直接申请一个连续的空间,内存碎片的出现会导致可申请的连续空间变小,比如如果上述区域2的内存空间较小,新的对象所需的内存空间大于2,那么2区域的内存就永远无法使用了,随着内存碎片的增多,这种情况会更加明显
2.复制算法
将内存
一分为2
,一半用于对象的存储,一般用于复制
上述标记清楚的方式最大的缺陷就在于连续空间的减少,通过复制算法就能解决上述问题
将区域2和4删除之后,剩余的区域1和3一起复制到内存的另一半,这样当有新的对象尝试申请内存时,就可以利用到左侧的连续的内存空间
但是复制算法的方式的缺点也很明显:
- 内存利用率不高,整个内存一分为2
- 如果有效的数据很多,挪动一次需要移动的数据很多,开销不容忽视
3.标记整理
上述两种方法都有着各自的缺陷,通过标记整理的方式能够进一步的提高效率和内存利用率
标记整理处理垃圾的方式类似于顺序表删除任意位置元素的实现
,在删除之后,需要从后往前挪动数据,来保证顺序表的连续性
标记整理也是这样,当有垃圾被回收之后,就把有效数据从后往前挪动,保证内存利用的连续性
但其实这种方式的开销也很大,也需要大量的挪动数据
JVM采用的实际上是一种更加高效的方式,利用一些经验规律
,达到内存利用和垃圾回收效率的最大化
,JVM内部采用的方式叫做分代回收
JVM把内存分为几个部分
- 伊甸区
- 幸存区
- 老年区
新new出来的对象会首先被存储到伊甸区(新生代)之中,经验表明,new出来的对象的生命周期是很短的,往往短时间内就会随着方法的结束而销毁,在一次扫描过程中就能被释放,没有被释放的对象就存储到幸存区之中
由于对象的销毁很快,大部分的对象在伊甸区中就被销毁了,所以在幸存去之中存储的对象很少,就比较适合使用复制算法,幸存区 的内存被一分为二.
幸存区也会被扫描线程扫描,不过扫描的频率比伊甸区之中要低很多,每扫描一次就利用复制算法对垃圾进行回收,往往在幸存区之中要进行多轮扫描
经过多轮扫描之后,如果仍有对象存储到幸存区之中,这些对象就会被转移到老年区之中,老年区的扫描频率更低
为什么扫描的频率越来越低呢?这其实也是一种经验规律,如果对象在第一次(伊甸区)之中没有被释放,那么其生存时间就比较长,证明该对象在短时间内不会被清除,如果在幸存区之中经过多轮扫描还是存活,就更加证明该对象在短时间之内不会被清除,不需要频繁的去扫描该对象
分代回收的这种机制就像是找工作,新生代就是笔试,对象多,淘汰率高,通过笔试就是进入了面试(幸存区),还要经过多轮的面试(在幸存去反复的被扫描),都通过了就进入老年代(拿到offer了,此时检查的频率就降低了,但是如果被标记为垃圾,就会被淘汰
以上就是JVM