前言
关于defer底层刨析请看专栏这一篇博文
Golang defer底层原理剖析
Go1.12
编译后的伪指令
defer指令对应到两部分内容
- deferproc负责把要执行的函数保存起来,我们称之为defer注册。
- 返回之前通过deferreturn执行注册的defer函数。
- 注册defer会创建一个_defer结构体,并且头插到runtime.g._defer链表中
- _defer结构体是在堆中,在执行时参数变量需要在堆栈直接拷贝
- deferreturn执行时依次执行runtime.g._defer链表每一项
// runtime/runtime2.go type g struct { ... _defer *_defer // defer 链表 ... }
步骤解析
deferproc
- 从defer pool预分配不同规格的defer,不满足时再创建,用完再放回池中。
- 进行堆分配_defer结构体,将参数拷贝到堆上
- 将该结构体头插到runtime.g._defer链表中
deferreturn
- 执行defer注册的funcval,将堆上的参数拷贝到栈上进行执行。
- 如果执行的是闭包,堆上分配捕获变量的地址,执行时通过指针加偏移量找到被捕获的变量进行执行
- 形如defer A(B(a))的情况,函数A需要依赖B的返回值进行堆分配内存大小,所以注册defer的时候直接会执行B(a)
存在的问题
- defer结构体堆分配,参数需要进行堆栈间拷贝。 GC
- 链表注册defer信息,执行比较慢。
Go1.13
性能提升:30%
runtime.deferprocStack
- 编译阶段:将defer的参数分配到栈帧的局部变量部分。
- defer结构体分配到栈上,通过deferprocStack注册到defer链表中,以减少defer的堆分配
- 但是对于循环defer或隐式循环注册还是需要进行堆分配
- defer结构体中加入heap字段区分是否为堆分配
runtime.deferreturn
- defer函数执行时拷贝参数,不过不是在堆栈之间,而是从栈上的局部变量空间,拷贝到参数空间。
- 分配到堆上的defer1.12还是进行参数的堆栈间拷贝
Go1.14
性能提升一个数量级
- 普通的 defer A(a,b) 会进行分配局部变量a,b,并在函数最后执行
- 对于带有条件的defer A2() 函数,需要到执行期间才知道是否需要执行
- 目标就是通过编译是插入代码,将defer在函数内进行展开执行,就不用defer结构体测创建和注册defer链表
引入df
变量进行标记df的每一个bit是0或1,来进行决定defer是否需要执行
执行过了标记为0,避免重复执行。
官方称1.14版本为open coded defer
不适用于循环defer和隐式注册,所以go1.12还是进行保留。
问题
panic()和runtime.GoExit() 退出需要执行defer链表,但是由于没注册链表,所以需要栈扫描的方式来找到未注册defer函数。所以panic更慢了。但是这样做是因为 整体性能优化 > panic发生的概率