垃圾回收器
垃圾回收是释放掉那些不再被使用的内存空间的过程。
换句话说,垃圾回收器会去检查哪些对象超出范围并且不会再被引用到,然后它回去释放掉那些对象占用的内存空间。这个过程实在 go 程序运行中以并发的方式去进行的,不是 go 程序执行之前,也不是 go 程序执行之后。go 垃圾回收器实现的说明文档给出了如下声明(runtime 包下的 mgc.go):
The GC runs concurrently with mutator threads, is type accurate (aka precise), allows multiple GC thread to run in parallel. It is a concurrent mark and sweep that uses a write barrier. It is non-generational and non-compacting. Allocation is done using size segregated per P allocation areas to minimize fragmentation while eliminating locks in the common case.
垃圾回收是和go线程同时运行的,它是类型精确的,而且多个垃圾回收线程可以并行运行。它是一种使用了写屏障的并发标记清除的垃圾回收方式。它是非分代和非压缩的。使用按P分配区域隔离的大小来完成分配,以最小化碎片,同时消除常见情况下的锁。
三色算法
go垃圾回收器的操作都是基于三色算法。
严格来说,在Go中这个算法的官方名称是叫做三色标记清除算法(tricolor mark-and-sweep algorithm)。它可以和程序一起并发工作并且使用写屏障(write barrier)。这就意味着,当Go程序员运行起来,go调度器去负责应用程序的调度,而垃圾回收器会像调度器处理常规应用程序一样,去使用多个goroutines去进行工作。
三色标记清除算法背后的首要原则就是它把堆中的对象根据它们的颜色分到不同集合里面,颜色是根据算法进行标记的。
黑色集合是为了确保没有任何指针指向白色集合。但是白色集合中的对象允许有指针指向黑色集合,因为这不会对垃圾回收器的操作产生影响。灰色集合可能会有指针指向白色集合里的对象。白色集合中的对象就是垃圾回收的候选对象。
注意到没有任何对象可以从黑色集合进到白色集合,这允许算法能够去操作并且清除白色集合里的对象。此外,没有任何黑色集合里的指针对象能够直接指向白色集合中的对象。
当垃圾回收开始,全部对象标记为白色,然后垃圾回收器会遍历所有根对象并把它们标记为灰色。根对象就是程序能直接访问到的对象,包括全局变量以及栈里面的东西。这些对象大多数取决于特定程序的go代码。在这之后,垃圾回收器选取一个灰色的对象,把它变为黑色,然后开始寻找去确定这个对象是否有指针指向白色集合的对象。这意味着当一个灰色对象由于被其它对象的指针所指而扫描到的时候,这个灰色对象会被标记为黑色。如果扫描发现这个灰色对象有一个或者更多指针指向白色对象时,会把所指向的白色对象放到灰色集合里。只要有灰色集合对象存在,这个过程就会一直进行下去。之后,白色集合里的对象就是没人访问的对象,并且它们所占用的内存可以被回收重用。因此,在这个点上,我们说白色集合里的元素被垃圾回收了。
在这个过程中,运行应用程序被叫做修改器(mutator)。mutator去运行一个小的方法叫做写屏障(write barrier),每次堆中的指针被修改写屏障都会去执行。如果堆中对象的指针被修改,就意味着那个对象现在是可触达的,写屏障会把它标记为灰色并把它放到灰色集合中。
mutator负责保持黑色集合中没有任何元素的指针去指向白色集合中的元素。这是在写屏障方法的帮助下完成的。如果维持这个不变状态失败的话,会毁坏垃圾回收过程,并且很可能会以一种丑陋和非预期的方式破坏你的程序。
go垃圾回收也可以应用于其它变量例如channel!当垃圾回收器发现一个channel是不可达的而且channel变量再也不会被访问到,它就会释放掉它的资源甚至说channel还没被关闭!
Go允许你通过在你的Go代码里放一个 runtime.GC() 的声明来手动去开启一次垃圾回收。但是,要记住一点, runtime.GC() 会阻塞调用器,并且它可能会阻塞整个程序,尤其是如果你想运行一个非常繁忙的而且有很多对象的go程序。这种情况发生,主要是因为你不能在其他任何事都在频繁变化的时候去处理垃圾回收,因为这种情况不会给垃圾
回收器机会,去清楚地确定白色、黑色和灰色集合里的成员。这种垃圾回收状态也被称作是垃圾回收安全点(garbage collection safe-point)。
垃圾回收器背后的更多操作
go垃圾回收器的主要关注点是低延迟,也就是说为了进行实时操作它会有短暂的暂停。另一方面,创建新对象然后使用指针操作存活对象是程序始终在做的事情,这个过程可能最终会创建出不会再被访问到的对象,因为没有指向那些对象的指针。这种对象即为垃圾对象,它们等待被垃圾回收器清理然后释放它们的空间。之后它们释放的空间可以再次被使用。
垃圾回收中使用的最简单的算法就是经典的标记清除算法(mark-and sweep):算法为了遍历和标记堆中所有可触达对象,会把程序停下来(stop the world)。之后,它会去清扫(sweeps)不可触达的对象。在算法的标记(mark)阶段,每个对象被标记为白色、灰色或黑色。灰色的子对象标记为灰色,而原始的对象此时会标记为黑色。没有更多灰色对象去检查的话就会开始清扫阶段。这个技术适用是因为没有从黑色指向白色的指针,这是算法的基本不变要素。
尽管标记清除算法很简单,但是它会暂停程序的运行,这意味着实际过程中它会增加延迟。go会通过把垃圾回收器作为一个并发的处理过程,同时使用前一节讲的三色算法,来降低这种延迟。但是,在垃圾回收器并发运行时候,其它的过程可能会移动指针或者创建对象,这会让垃圾回收器处理非常困难。所以,让三色算法并发运行的关键点就是,维持标记清除算法的不变要素即没有黑色的对象能够指向白色集合对象。
因此,新对象必须进入到灰色集合,因为这种方式下标记清除的不变要素不会被改变。另外,当程序的一个指针移动,要把指针所指的对象标记为灰色。你可以说灰色集合是白色集合和黑色集合中间的“屏障”。最后,每次一个指针移动,会自动执行一些代码,也就是我们之前提到的写屏障,它会去进行重新标色。为了能够并发运行垃圾回收器,写屏障代码产生的延迟是必要的代价。
一定要记住,Go垃圾回收器是一个实时的垃圾回收器 ,它是和其他goroutines一起并发运行的。