go的垃圾回收
注:Go语言中使用的垃圾回收使用的是标记清扫算法。进行垃圾回收时会 stoptheworld。不过在Go语言 1.3 版本中,实现了精确的垃圾回收和并行的垃圾回收,大大地提高了垃圾回收的速度,进行垃圾回收时系统并不会长时间卡住。
1. 标记清扫算法
(1)标记清扫算法是一个很基础的垃圾回收算法,该算法中有一个标记初始的 root 区域,以及一个受控堆区。root 区域主要是程序运行到当前时刻的栈和全局数据区域。在受控堆区中,很多数据是程序以后不需要用到的,这类数据就可以被当作垃圾回收了。
(2)判断一个对象是否为垃圾,就是看从 root 区域的对象是否有直接或间接的引用到这个对象。如果没有任何对象引用到它,则说明它没有被使用,因此可以安全地当作垃圾回收掉。
(3)标记清扫算法分为两阶段,分别是标记阶段和清扫阶段。
标记阶段,从 root 区域出发,扫描所有 root 区域的对象直接或间接引用到的对象,将这些对上全部加上标记;
清扫阶段,扫描整个堆区,对所有无标记的对象进行回收。
2.位图标记和内存布局
既然垃圾回收算法要求给对象加上垃圾回收的标记,显然是需要有标记位的。一般的做法会将对象结构体中加上一个标记域,一些优化的做法会利用对象指针的低位进行标记,这都只是些奇技淫巧罢了。Go 没有这么做,它的对象和 C 的结构体对象完全一致,使用的是非侵入式的标记位,我们看看它是怎么实现的。
堆区域对应了一个标记位图区域,堆中每个字(不是 byte,而是 word)都会在标记位区域中有对应的标记位。每个机器字(32 位或 64 位)会对应 4 位的标记位。因此 64 位系统中相当于每个标记位图的字节对应 16 个堆中的字节。
虽然是一个堆字节对应 4 位标记位,但标记位图区域的内存布局并不是按 4 位一组,而是 16 个堆字节为一组,将它们的标记位信息打包存储的。每组 64 位的标记位图从上到下依次包括:
16 位的特殊位、标记位;
16 位的垃圾回收标记位;
16 位的无指针 / 块边界的标记位;
16 位的已分配标记位。
这样设计使得对一个类型的相应的位进行遍历很容易。
前面提到堆区域和堆地址的标记位图区域是分开存储的,其实它们是以 mheap.arena_start 地址为边界,向上是实际使用的堆地址空间,向下则是标记位图区域。以 64 位系统为例,计算堆中某个地址的标记位的公式如下:
偏移 = 地址 - mheap.arena_start
标记位地址 = mheap.arena_start - 偏移/16 - 1
移位 = 偏移 % 16
标记位 = *标记位地址 >> 移位
基本的标记过程
3.标记的过程
1.从最简单的开始看,基本的标记过程,有一个不带任何优化的标记的实现,对应于函数 debug_scanblock。
debug_scanblock 函数是递归实现的,单线程的,更简单更慢的 scanblock 版本。该函数接收的参数分别是一个指针表示要扫描的地址,以及字节数。
2.首先要将传入的地址,按机器字节大小对齐。然后对待扫描区域的每个地址:
找到它所属的 MSpan,将地址转换为 MSpan 里的对象地址。
根据对象的地址,找到对应的标记位图里的标记位。
3.判断标记位,如果是未分配则跳过。否则加上特殊位标记(debug_scanblock 中用特殊位代码的 mark 位)完成标记。
4.判断标记位中标记了无指针标记位,如果没有,则要递归地调用 debug_scanblock。
这个递归版本的标记算法还是很容易理解的。其中涉及的细节在上节中已经说过了,比如任意给定一个地址,找到它的标记位信息。很明显这里仅仅使用了一个无指针位,并没有精确的垃圾回收。
写在最后
最后:
🐱对于刚刚入门的同学,多少听起来会有点迷糊,但是没关系,不妨去牛客看一看对于go新生肯定会有很大的帮助滴。不要着急,不要慌,月亮下面有月光,循着月光找月亮,🌜🌜🌜快来🐂牛客🐂吧!