Go的闭包看你犯错,但Rust的lifetime却默默帮你排坑

简介: Go有GC因此很多程序员也不关注对象的释放问题,不过一旦与闭包结合就容易出现问题,本文对此进行排坑,并介绍Rust的做法

闭包(Closure)在某些编程语言中也被称为 Lambda 表达式,是能够读取其他函数内部变量的函数。一般只有函数内部的子函数才能读取局部变量,所以闭包这样一个函数内部的函数,在本质上是将函数内部和函数外部连接起来的桥梁。

在实践当中,假如我们需要统计一个函数被调用的次数,最简单的方式就是定义一个全局变量,每当目标函数被调用时就将此变量加1,但是全局变量会带来很多误用等问题,安全性往往得不到保证;而为调用次数专门设计一个以计数的接口又太小题大做了。

但是通过闭包就比较容易实现计数功能,以Go语言为例具体代码及注释如下:

package main   import (  "fmt" )   func SomeFunc() func() int { // 创建一个函数,返回一个闭包,闭包每次调用函数会对函数内部变量进行累加  var CallNum int = 0 //函数调用次数,系函数内部变量,外部无法访问,仅当函数被调用时进行累加    return func() int { // 返回一个闭包    CallNum++ //对value进行累加  //实现函数具体逻辑    return CallNum // 返回内部变量value的值  } }   func main() {    accumulator := SomeFunc() //使用accumulator变量接收一个闭包    // 累加计数并打印  fmt.Println("The first call CallNum is ", accumulator()) //运行结果为:The first call CallNum is 1  // 累加计数并打印  fmt.Println("The second call CallNum is ", accumulator()) //运行结果为:The second call CallNum is 2   }

运行结果为:

The first call CallNum is 1 The second call CallNum is 2

可以看到我们通过闭包即没有暴露CallNum这个变量,又实现了为函数计数的目的。

Goroutine+闭包却出了莫名其妙的BUG

在Go语言中,闭包所依托的匿名函数也是Goroutine所经常用到的方案之一,但是这两者一结合却容易出现极难排查的BUG,接下来我把出现问题的代码简化一下,请读者们来看下面这段代码:

import (  "fmt"  "time" )   func main() {    tests1ice := []int{1, 2, 3, 4, 5}    for _, v := range tests1ice {  go func() {    fmt.Println(v)    }()  }    time.Sleep(time.Millisecond) }

这段代码的逻辑不难看懂,其目标是通过Goroutine将1,2,3,4,5乱序输出到屏幕上,但最终执行结果却如下:

5 5 5 3 5 成功: 进程退出代码 0.

也就是只有大多数情况下只有5被输出出来了,1-4几乎没有什么机会登场,这里简要复述一下问题的排查过程,由于没有在Goroutine中对切片执行写操作,所以首先排除了内存屏障的问题,最终还是通过反编译查看汇编代码,发现Goroutine打印的变量v,其实是地址引用,Goroutine执行的时候变量v所在地址所对应的值已经发生了变化,汇编代码如下:

for _, v := range tests1ice {  499224:       48 8d 05 f5 af 00 00    lea    0xaff5(%rip),%rax        # 4a4220 <type.*+0xa220>  49922b:       48 89 04 24             mov    %rax,(%rsp)  49922f:       e8 8c 3a f7 ff          callq  40ccc0 <runtime.newobject>  499234:       48 8b 44 24 08          mov    0x8(%rsp),%rax  499239:       48 89 44 24 48          mov    %rax,0x48(%rsp)  49923e:       31 c9                   xor    %ecx,%ecx  499240:       eb 3e                   jmp    499280 <main.main+0xc0>  499242:       48 89 4c 24 18          mov    %rcx,0x18(%rsp)  499247:       48 8b 54 cc 20          mov    0x20(%rsp,%rcx,8),%rdx  49924c:       48 89 10                mov    %rdx,(%rax)  go func() {  49924f:       c7 04 24 08 00 00 00    movl   $0x8,(%rsp)  499256:       48 8d 15 f3 b7 02 00    lea    0x2b7f3(%rip),%rdx        # 4c4a50 <go.func.*+0x6c>  49925d:       48 89 54 24 08          mov    %rdx,0x8(%rsp)  499262:       48 89 44 24 10          mov    %rax,0x10(%rsp)  499267:       e8 54 3a fa ff          callq  43ccc0 <runtime.newproc>

可Goroutine中fmt.Println所处理的v,其实是v的地址中所对应的值。这也是产生这个BUG的基本原因。

找到了问题的原因,解决起来也就简单多了。

解决方案一:在参数方式向匿名函数传递值引用,具体代码如下:

package main   import (  "fmt"  "time" )   func main() {    tests1ice := []int{1, 2, 3, 4, 5}    for _, v := range tests1ice {  go func(v int) {    fmt.Println(v)    }(v)  }    time.Sleep(time.Millisecond) }  

解决方案二:在调用gorouinte前将变量进行值拷贝

package main   import (  "fmt"  "time" )   func main() {    tests1ice := []int{1, 2, 3, 4, 5}    for _, v := range tests1ice {  w := v  go func() {      fmt.Println(w)    }()  }    time.Sleep(time.Millisecond) }

总而言之只要传值就没事,而传地址引用就会出现问题。

Rust为什么行

利用周末时间我想看看上述问题代码在Rust的实现中是如何处理的,却有比较意外的收获,我们来看上述代码的Rust实现,

use std::thread; use std::time::Duration;   fn main() {  let arr = [1, 2, 3, 5, 5];  for i in arr.iter() {  let handle = thread::spawn(move || {  println!("{}", i);  });  }  thread::sleep(Duration::from_millis(10)); }

但是上述这段代码编译都无法通过,原因是arr这个变量的生命周期错配。具体编译结果如下:

error[E0597]: `arr` does not live long enough  --> hello16.rs:6:14  | 6  |     for i in arr.iter() {  |              ^^^  |              |  |              borrowed value does not live long enough  |              cast requires that `arr` is borrowed for `'static` ... 13 | }  | - `arr` dropped here while still borrowed   error: aborting due to previous error; 1 warning emitted

我们刚刚提到过匿名函数其实是通过地址引用的方式来访问局部变量的,而地址引用也就对应Rust当中借用的概念,那么我们就可以推出来for i in arr.iter()中的 arr.iter()实际是对arr的借用,这个借用后的结果i被let handle = thread::spawn(move 中的move关键字强制转移走了,因此在handle线程离开作用域之后就被释放了,而下次迭代时arr变量由于lifetime的问题不能被编译器编译通过。

为了更简要的说明这个问题我们来看下面的代码:

fn main() {  {  let x;  {  let y = 5;  x = &y;// x借用y的值    }  // y在这里已经被释放,因此借用y的x也不能通过lifetime检查  println!("x: {}", x);    } }

x借用y的值,如果在y的lifetime以外,再出现x的访问就会出现问题。如果想避免这个问题就不能再使用借用的机制,可以编译通过的代码如下:

use std::thread; use std::time::Duration;   fn main() {  let arr = [1, 2, 3, 5, 5];  for i in arr.iter() {//这段代码中i是对arr的借用  let j=i+1;//j通过值拷贝的方式获取了i的值  let handle = thread::spawn(move || {//move将j强制转移给了handle  println!("{}", j);  });//这里j超出lifetime就不会影响到i了  }  thread::sleep(Duration::from_millis(10)); }

新添加的let j=i+1;是通过值拷贝的方式将i和j剥离了,因此j在被释放的时候就不会影响到arr的借用i了。

凡是编译器能发现的错误,都不会形成问题。通过这个Go语言问题的排查,我对于Rust的变量生命周期检查机制有了更进一步的认识,不得不承认虽然Rust学起来比较劝退,但是其安全语言的名号真是所言不虚,强制让程序员做正确事,如果能知其然又知其所以然,那么提升将是巨大的。

相关文章
|
7月前
|
Rust 安全 程序员
|
Go
Go 语言使用 goroutine 运行闭包的“坑”
Go 语言使用 goroutine 运行闭包的“坑”
61 0
|
Serverless Go
Go语言闭包不打烊,让你长见识!
Go语言闭包不打烊,让你长见识!
52 0
|
4月前
|
存储 运维 安全
go语言中闭包与匿名函数是什么?
本文探讨了Go语言中的匿名函数与闭包。首先介绍了匿名函数的定义与使用方式,包括直接调用、赋值给变量以及作为全局变量的应用。接着深入解析了闭包的概念及其本质,强调闭包能实现状态保持,但也警告其不当使用可能导致复杂的内存管理和运维问题。通过示例展示了如何利用闭包实现累加器功能,并对比了使用结构体字段的方法。最后,通过一个并发场景的示例说明了闭包在Go中处理多协程安全访问共享数据的应用,展示了闭包结合锁机制确保数据一致性的方式。
|
3月前
|
Rust Linux Go
Rust/Go语言学习
Rust/Go语言学习
|
4月前
|
编译器 Go
Go语言中的闭包:封装数据与功能的强大工具
Go语言中的闭包:封装数据与功能的强大工具
|
5月前
|
Rust 编译器 程序员
Rust与C++的区别及使用问题之Rust避免多线程中的lifetime的问题如何解决
Rust与C++的区别及使用问题之Rust避免多线程中的lifetime的问题如何解决
|
6月前
|
Go
go的函数定义、递归、延迟、匿名、高阶、闭包
go的函数定义、递归、延迟、匿名、高阶、闭包
|
7月前
|
Rust 安全 Java
Rust 和 Go:如何选择最适合你的编程语言
Rust 和 Go 都是优秀的选择 首先,重要的是要说 Rust 和 Go 都是非常优秀的编程语言。它们都是现代的、强大的,被广泛采用,且提供了卓越的性能。
84 1
|
6月前
|
Go
Go语言进阶篇——浅谈函数中的闭包
Go语言进阶篇——浅谈函数中的闭包