Go语言GC：吞吐量和延迟的博弈-阿里云开发者社区

Go语言GC：吞吐量和延迟的博弈

2023-10-19 131

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Go语言GC：吞吐量和延迟的博弈

/ 深入剖析 Go 语言垃圾回收及 SetFinalizer 用法 /

一、概述

Go 语言采用垃圾回收机制来自动回收无用的变量内存。本文将详细介绍 Go 语言垃圾回收的工作原理、分类算法以及 SetFinalizer 函数的用法。

主要内容包括:

Go 语言内存管理

垃圾回收基本原理

可达性分析算法

生成式垃圾回收

三色标记算法

并发垃圾回收

SetFinalizer 函数

finalize 函数语义

使用实例:关闭文件

延迟回收对象

定时触发 finalize

优化内存占用

扩展阅读-调优参数

垃圾回收不足之处

通过本文可以深入理解 Go 的垃圾回收机制,并使用 SetFinalizer 优雅地管理资源。

二、Go 语言内存管理

Go 语言中的内存分配主要分为两种:

栈内存:存放值类型对象

堆内存:存放引用类型对象

使用内存后需要回收,Go 语言采用自动垃圾回收机制管理堆内存。

三、垃圾回收基本原理

Go 语言的垃圾回收器会定期执行标记-清除算法来回收无用对象占用的内存。

工作原理可以简化为以下几个步骤:

垃圾回收开始时,暂停所有 goroutine

标记所有正在使用的对象

清除所有没有标记的对象

回收这些对象的内存

垃圾回收结束,恢复 goroutine

这种“标记-清除”实现了高效自动的内存回收。

四、可达性分析算法

具体的“标记”阶段,垃圾回收器使用可达性分析算法:

从 GC Roots 对象开始作为起点,从这些节点开始遍历和搜索,所有被遍历到的对象就是正在使用的活动对象,而没有被遍历到的对象将被判定为要回收的目标。

a := Object{}
b := Object{}
a.b = &b

这里 a 和 b 互相引用,都可达,不会被回收。

但如果:

a := Object{}
b := Object{} 
a.b = &b
a = nil

将 a 设置为 nil 后,b 变为不可达,在 GC 时可以被回收。

五、生成式垃圾回收

Go 语言采用了生成式的垃圾回收方法。

在这种方法下,对象内存分为两种:

从旧对象分配的内存称为黑色对象

新分配内存称为白色对象

在垃圾回收时,只有白色对象可能被回收,黑色对象一定存活。

这样可以简化标记过程,提高回收效率。

六、三色标记算法

具体的可达性分析采用三色标记算法实现,对象标记为三种颜色:

白色:对象未被标记的候选对象

灰色:访问过的临时对象

黑色:被标记的活跃对象

标记过程采用灰度推进,直到没有白色对象后结束。

七、并发垃圾回收

Go 语言从 1.5 版本开始,采用并发标记的方法,可以一边执行应用程序,一边进行标记回收。

并发回收的关键是写屏障技术,通过卡屏可达性分析,然后解除屏障恢复程序执行。

并发垃圾回收减少了应用程序的暂停时间。

八、SetFinalizer 函数

Go 语言还提供了 SetFinalizer 来指定对象被回收时的回调函数:

将 a 设置为 nil 后,b 变为不可达,在 GC 时可以被回收。
五、生成式垃圾回收
Go 语言采用了生成式的垃圾回收方法。
在这种方法下,对象内存分为两种:
从旧对象分配的内存称为黑色对象
新分配内存称为白色对象
在垃圾回收时,只有白色对象可能被回收,黑色对象一定存活。
这样可以简化标记过程,提高回收效率。
六、三色标记算法
具体的可达性分析采用三色标记算法实现,对象标记为三种颜色:
白色:对象未被标记的候选对象
灰色:访问过的临时对象
黑色:被标记的活跃对象
标记过程采用灰度推进,直到没有白色对象后结束。
七、并发垃圾回收
Go 语言从 1.5 版本开始,采用并发标记的方法,可以一边执行应用程序,一边进行标记回收。
并发回收的关键是写屏障技术,通过卡屏可达性分析,然后解除屏障恢复程序执行。
并发垃圾回收减少了应用程序的暂停时间。
八、SetFinalizer 函数
Go 语言还提供了 SetFinalizer 来指定对象被回收时的回调函数:

当 file 对象被回收时,会调用关闭文件回调。

九、finalize 函数语义

需要注意的是,finalize 函数只用来触发清理操作,而不能阻止对象被回收。

也不能依靠它来完成关键逻辑,GC 时间不定时。

正确的语义应该是:

func (obj *Object) finalize() {
  // 清理资源
  closeFile()
  // 重要的数据已同步其他地方
}

只完成清理工作,关键数据不依赖 finalize。

十、使用实例:关闭文件

关闭文件是一个常见的使用场景:

// 打开文件
f, _ := os.Open("test.txt")
// 注册finalizer
runtime.SetFinalizer(f, func(f *os.File) {
  fmt.Println("Closing file")
  f.Close() // 关闭文件
})
// 使用文件
buf := make([]byte, 10)
f.Read(buf)
// f会在GC时自动关闭

文件关闭不依赖 GC 时机,只是清理工作。

十一、延迟回收对象

使用 finalizer 时,对象回收会延迟,只有触发了 finalize 函数后才会回收对象:

type Obj struct{} 
func (o *Obj) Close() {
  fmt.Println("Closing Obj")
}
obj := &Obj{}
runtime.SetFinalizer(obj, func(obj *Obj) {
  obj.Close() // 执行关闭  
})
// 保证obj不被优先回收
runtime.KeepAlive(obj)

obj 会在 finalize 后才被回收,KeepAlive 使得 obj 不被提前回收

十二、定时触发 finalize

也可以通过定时器强制周期性触发 finalize,不依赖 GC:

timer := time.NewTimer(time.Second * 60)
for range timer.C {
  runtime.GC() // 主动触发GC
}

定时 GC 调用,可以定期触发 finalize。

十三、优化内存占用

合理使用 finalizer 可以及时释放资源,优化内存占用。具体做法包括:

为打开的文件资源、网络连接等注册 finalizer,使其被 GC 时自动关闭和释放

将不再使用的大对象显式设置为 nil,使其可被 GC 回收

及时关闭不再使用的通道,避免 goroutine 泄露和通道阻塞

调整 GC 频率,降低内存占用峰值

减少变量作用域,及时释放不再使用的内存

这样可以尽快释放不再需要的内存,减轻 GC 压力,有效控制内存占用。

十四、调优 GC 参数

Go 语言提供了调整 GC 参数的方式,主要包括:

GOGC: GC 频率的设置,比如 GOGC=800 将触发更频繁的 GC

GOMAXPROCS: 并行 GC 使用的 CPU 数,默认逻辑 CPU 数

GCTimeThreshold: GC 的暂停时间阈值,超过阈值强制并行 GC

但建议不要随意修改这些参数,只有在测量和定位明确的性能问题后才调整。

十五、垃圾回收不足

Go 当前 GC 主要存在以下不足:

停顿时间不可控,对延迟敏感服务不友好

无法收回已分配但未使用的内存

算法优化空间还很大,比如延迟回收等

对大对象垃圾回收不够高效

这需要通过改进算法、应用层优化来不断改善。但总体上 Go GC 对大多数应用已经足够高效。

十六、总结

Go 语言的垃圾回收具备高效的并发标记回收特性。但也需要注意它的不足之处。

利用 SetFinalizer 可以更精细地释放资源。理解 GC 工作原理可以帮助更好地分配和管理内存。

Go语言GC：吞吐量和延迟的博弈

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Go语言GC：吞吐量和延迟的博弈

热门文章

最新文章

相关课程

相关电子书

相关实验场景