defer 是什么?
defer 修饰的函数是一个延迟函数,在包含它的函数返回时运行。
defer 执行时机
A "defer" statement invokes a function whose execution is deferred to the moment the surrounding function returns, either because the surrounding function executed a return statement, reached the end of its function body, or because the corresponding goroutine is panicking
defer 触发时机是:
- 函数执行到函数体末端
- 函数执行return语句
- 当前协程panic
defer 实现原理
defer 数据结构源码在 src/runtime/runtime2.go
type _defer struct { siz int32 // 由deferproc第一个参数传入,参数和结果的内存大小 started bool // 标识defer函数是否已经开始执行 heap bool // 堆分配、栈分配 openDefer bool //表示当前 defer 是否经过开放编码的优化 sp uintptr // 栈指针程序计数器,注册defer函数的函数栈指针 pc uintptr // 调用方程序计数器,deferproc函数返回后要继续执行的指令地址 fn *funcval // 由deferproc的第二个参数传入,也就是被注册的defer函数 _panic *_panic // 是触发defer函数执行的panic指针,正常流程执行defer时它就是nil link *_defer //结构体是延迟调用链表上的一个元素,所有的结构体都会通过 link 字段串联成链表。 }
defer 执行机制
在中间代码生成阶段, 有三种不同的机制处理 defer 关键字
- 堆上分配(Go 版本1.1-1.12)默认兜底方案
- 栈分配(Go版本 1.13 )相比堆分配能够减少 30%堆额外开销。
- 开放编码(Go 版本 1.14) 额外开销可以忽略不计。
堆上分配
- 在
defer
语句堆位置插入runtime.deferproc
, 在被执行时,延迟调用会被保存为一个_defer
记录,并将被延迟调用的入口地址与参数复制保存,存入Gorountine
的调用链表中。 - 在函数返回之前的位置插入
runtime.deferreturn
,当被执行时,会将延迟调用从Goroutine
链表中取出并执行,多个延迟调用则以jmpdefer
尾递归调用方式连续执行
runtime.deferproc
负责注册, runtime.deferreturn
负责执行。
derfer 关键字最重要的三个函数
- deferproc。在每遇到一个defer关键字时,实际上都会转换为deferproc函数,deferproc函数的作用是将defer函数存入链表中。(go关键字是使用newproc函数,它两的实现有着不少相似之处)
- deferreturn。在return指令前调用,从链表中取出defer函数并执行。
- deferprocStack。go1.13后对defer做的优化,通过利用栈空间提高效率。
call 函数
cmd/compile/internal/gc.state.call
会负责为所有函数和方法调用生成中间代码:
- 获取需要执行的函数名,代码制作和函数调用的接收方
- 需要获取栈地址并将函数或者方法的参数写入栈中
- 使用
cmd/compile/internal/gc.state.newValue1A
函数生成函数调用的中间代码 - 如果当前调用的函数是
defer
, 那么会单独生成相关的结束代码块。 - 获取函数的返回值,并结束当前调用。
// Calls the function n using the specified call type. // Returns the address of the return value (or nil if none). func (s *state) call(n *Node, k callKind) *ssa.Value { var call *ssa.Value if k == callDeferStack { // 在栈上初始化 defer 结构体 call = s.newValue1A(ssa.OpStaticCall, types.TypeMem, deferprocStack, s.mem()) ... } else { ... switch { case k == callDefer: call = s.newValue1A(ssa.OpStaticCall, types.TypeMem, deferproc, s.mem()) ... } call.AuxInt = stksize } s.vars[&memVar] = call ... }
deferproc 函数
runtime.deferproc
的功能时注册延迟函数,会为 defer
创建一个新的 runtime._defer
的结构体、设置它的函数指针 fn
、程序计数器 pc
和 栈制作 sp
并将相关的函数参数拷贝到相邻的内存空间。
- deferproc 函数有两个参数, 第一个是被注册的 defer 函数的参数返回值占多少字节。第二个参数是一个
runtime.funcval
结构体的指针 - runtime.newdefer通过 runtime.mallocgc 在堆上创建一个新的结构体,并添加到
link
字段上形成链表。 - 最后调用的
runtime.return0
是唯一一个不会触发延迟调用的函数,它可以避免递归runtime.deferreturn
的递归调用。
func deferproc(siz int32, fn *funcval) { // 这里的g就是gorouutine,详看golang的调度模型 // 只有用户使用的goroutine可以应用defer if getg().m.curg != getg() { throw("defer on system stack") } sp := getcallersp() // 调用deferproc之前的rsp寄存器的值 argp := uintptr(unsafe.Pointer(&fn)) + unsafe.Sizeof(fn) callerpc := getcallerpc() // deferproc函数的返回地址,也就是执行完defer后应当跳回哪段代码上 d := newdefer(siz) if d._panic != nil { throw("deferproc: d.panic != nil after newdefer") } d.fn = fn d.pc = callerpc d.sp = sp // 对defer函数参数进行处理 switch siz { case 0: // Do nothing. case sys.PtrSize: *(*uintptr)(deferArgs(d)) = *(*uintptr)(unsafe.Pointer(argp)) default: memmove(deferArgs(d), unsafe.Pointer(argp), uintptr(siz)) } return0() }
先通过 newdefer 获取一个 defer 关键字的插入顺序是从后向前的,而 defer 关键字执行是从前向后的,后调用的 defer 会优先执行。
newdefer追加新等延迟调用
deferreturn 函数
runtime.deferreturn
是触发延迟函数链表的执行,会从 Goroutine
的 _defer
链表中取出最前面的 runtime._defer 并调用 runtime.jmpdefer 传入需要执行的函数和参数。
- runtime.jmpdefer 是一个用汇编语言实现的运行时函数,它的主要工作是跳转到 defer 所在的代码段并在执行结束之后跳转回 runtime.deferreturn。
- runtime.deferreturn 会多次判断当前 Goroutine 的 _defer 链表中是否有未执行的结构体,该函数只有在所有延迟函数都执行后才会返回
- 最后调用的 runtime.return0 是唯一一个不会触发延迟调用的函数,它可以避免递归 runtime.deferreturn 的递归调用。
func deferreturn(arg0 uintptr) { gp := getg() d := gp._defer if d == nil { // 结束条件1,没有defer函数了,也就是所有defer函数都执行完成了 // 还记得defer的链式结构吗,其实就是一个递归函数不断调用 // 为nil的话就代表这条链遍历完成了 return } sp := getcallersp() if d.sp != sp { // 结束条件2,如果保存在_defer对象中的sp值与调用deferretuen时的栈顶位置不一样,直接返回 // 因为sp不一样表示d代表的是在其他函数中通过defer注册的延迟调用函数,比如: // a()->b()->c()它们都通过defer注册了延迟函数,那么当c()执行完时只能执行在c中注册的函数 return } switch d.siz { case 0: // Do nothing. case sys.PtrSize: *(*uintptr)(unsafe.Pointer(&arg0)) = *(*uintptr)(deferArgs(d)) default: memmove(unsafe.Pointer(&arg0), deferArgs(d), uintptr(d.siz)) } fn := d.fn d.fn = nil gp._defer = d.link freedefer(d) jmpdefer(fn, uintptr(unsafe.Pointer(&arg0))) }
包含如下几个步骤:
- 判断执行条件
- 参数拷贝
- 释放_defer对象
- 执行函数
值得一提的是,defer具有即时传值的特点,defer也同样满足闭包和匿名函数的特性。
以代码为例子,讲解 defer 注册和执行流程
// 源程序 func A1(a int) { fmt.Println(a) } func A() { a, b := 1, 2 defer A1(a) a = a + b fmt.Println(a, b) } //函数A编译后的伪指令 func A() { a, b := 1, 2 runtime.deferproc(8, A1,1) // siz=8, A1=延迟函数入口, 1=A1函数入参 a = a + b fmt.Println(a, b)//3,2 runtime.deferreturn()//执行defer链表 return }
- 函数A定义局部变量a=1,b=2,存储在A函数的栈中
- deferproc函数注册defer函数A1时,
- func deferproc(siz int32, fn *funcval)
- siz:A1没有返回值,64位下一个整型参数占用8字节。
- fn:A1函数入口地址,addr1
deferproc函数调用时,编译器会在它自己的两个参数后面,开辟一段空间,用于存放defer函数A1的返回值和参数。这一段空间会在注册defer时,直接拷贝到_defer结构体的后面。
- 在堆上分配存储空间,并存放_defer结构体
- A1的参数加返回值共占8字节
- defer函数尚未执行,所以started=false
- sp就是调用者A的栈指针
- pc就是deferproc函数的返回地址return addr
- 被注册的function value为A1
- defer结构体后面的8字节用来保存传递给A1的参数。然后这个_defer结构体就被添加到defer链表头,deferproc注册结束。
频繁的堆分配势必影响性能,所以Go语言会预分配不同规格的deferpool,执行时从空闲_defer中取一个出来用。没有空闲的或者没有大小合适的,再进行堆分配。用完以后,再放回空闲_defer池。这样可以避免频繁的堆分配与回收。
deferreturn执行defer链表:从当前goroutine找到链表头上的这个_defer结构体,通过_defer.fn找到defer函数的funcval结构体,进而拿到函数A1的入口地址。接下来就可以调用A1了。调用A1时,会把_defer后面的参数与返回值整个拷贝到A1的调用者栈上。然后A1开始执行,输入参数值a=1。