go-issues#14592 runtime: let idle OS threads exit 内核线程暴增与线程回收问题

简介: go-issues#14592 runtime: let idle OS threads exit 内核线程暴增与线程回收问题

前言

  在社区issues#14592可以看到,go中的空闲线程是不会自动回收的(注意是线程而不是协程,GMP模型中的M),那么就衍生出了三个问题

  1. 为什么会产生空闲线程
  2. 如何限制最大线程数量
  3. 怎么回收空闲线程

CPU线程与OS线程

这个一级目录算是补充一下os的知识吧

CPU线程与OS线程有什么区别和联系呢?操作系统中的进程可以很多,进程中的线程就更多了,常常有几十个上百个。OS中的线程有自己的栈空间,和同一进程中的其他线程共享地址空间等等;CPU中的线程就那么固定几个(例如四核八线程),是真正的计算资源。

两者都叫线程(Thread)是因为他们都是调度的基本单位。软件的调度基本单位是OS的线程,硬件的调度基本单位是CPU中的线程。操作系统负责把它产生的软线程调度到CPU中的硬线程中去进行计算

  GMP模型中的M皆是OS中的线程,所以后续所说的线程线程都是OS中的

为什么会产生空闲线程

  如果不熟悉GMP模型请先弄明白了深入理解GMP模型再接着读后续

  我们都知道GOMAXPROCS可以设置GMP中P的数量,那么GOMAXPROCS到底代表什么含义呢?

The GOMAXPROCS variable limits the number of operating system threads that can execute user-level Go code simultaneously.

There is no limit to the number of threads that can be blocked in system calls on behalf of Go code; those do not count against the GOMAXPROCS limit.

This package’s GOMAXPROCS function queries and changes the limit.

GOMAXPROCS 变量限制了可以同时执行用户级 Go 代码的操作系统线程数。

代表Go代码在系统调用中可以阻塞的线程数没有限制; 这些不计入GOMAXPROCS 限制。

这个包的 GOMAXPROCS 函数查询和更改限制。  注意这里的重点在系统调用中可以阻塞的线程数没有限制; 这些不计入GOMAXPROCS 限制,也就是说在系统调用中被阻塞的线程不在此限制之中。

 那么问题就来了,在深入理解GMP模型的场景10中,我们说过,一旦这个G陷入系统调用了,那么与之对应的M和P就会解除绑定,而G和M绑定在一起,直到解除阻塞,

 那么在陷入系统调用之后,因为在系统调用中可以阻塞的线程数没有限制; 这些不计入GOMAXPROCS 限制的原因,就会有新的M与P绑定,那么解除阻塞后,G回到了全局队列中,这个M呢?因为它没有P,所以它得不到任务,此时M就是空闲线程了。

 那么问题来了,如果短时间内,GO程序存在大量的系统调用,那线程数量不就暴涨了?

 这也就是为什么在深入理解GMP模型的(1)GMP模型简介里面说,GO语言本身的原因,把M限制为10000的原因,这个值存在的主要目的是限制可以创建无限数量线程的GO程序,即在程序把操作系统干爆之前,干掉程序。

如何限制最大线程数量

GO提供了debug.SetMaxThreads()方法可以让我们限制最大线程数量

先来看不做限制的情况

package main
import (
  "fmt"
  "net"
  "runtime/pprof"
  "sync"
)
var threadProfile = pprof.Lookup("threadcreate")
func main() {
  fmt.Println("创建协程之前的线程数量:", threadProfile.Count())
  var wg sync.WaitGroup
  for i := 0; i < 100; i++ {
    wg.Add(1)
    go func() {
      defer wg.Done()
      for j := 0; j < 100; j++ {
        net.LookupHost("www.baidu.com")
      }
    }()
  }
  wg.Wait()
  fmt.Println("创建协程之后的线程数量:", threadProfile.Count())
}
创建协程之前的线程数量: 6
创建协程之后的线程数量: 88

限制的情况

package main
import (
  "fmt"
  "net"
  "runtime/debug"
  "runtime/pprof"
  "sync"
)
var threadProfile = pprof.Lookup("threadcreate")
func main() {
  debug.SetMaxThreads(10)
  fmt.Println("创建协程之前的线程数量:", threadProfile.Count())
  var wg sync.WaitGroup
  for i := 0; i < 100; i++ {
    wg.Add(1)
    go func() {
      defer wg.Done()
      for j := 0; j < 100; j++ {
        net.LookupHost("www.baidu.com")
      }
    }()
  }
  wg.Wait()
  fmt.Println("创建协程之后的线程数量:", threadProfile.Count())
}
创建协程之前的线程数量: 6
runtime: program exceeds 10-thread limit
fatal error: thread exhaustion

当程序启动的线程M超过我们所设置的线程数量时,就会立马报错

怎么回收空闲线程

  issues#14592提出的问题就是让空闲的 OS 线程退出,不过目前并没有一个完美的解决方案,有人提出用runtime.LockOSThread()杀死线程,下面来介绍这个方法

  1. 调用 LockOSThread 函数会把当前 G 绑定在当前的系统线程 M 上,这个 G 总是在这个 M 上执行,并且阻止其它 G 在该 M 执行
  2. 只有当前 G 调用了与之前调用 LockOSThread 相同次数的 UnlockOSThread 函数之后,G 与 M 才会解绑
  3. 如果当前 G 在退出时,没有调用 UnlockOSThread,这个线程会被终止

利用第三个特性,在启动 G 时,调用 LockOSThread 来独占一个 M。当 G 退出时,而不调用 UnlockOSThread,那这个 M 就会被终止杀死了

package main
import (
  "fmt"
  "net"
  "runtime"
  "runtime/pprof"
  "sync"
)
var threadProfile = pprof.Lookup("threadcreate")
func main() {
  fmt.Println("创建协程之前的线程数量:", threadProfile.Count())
  var wg sync.WaitGroup
  for i := 0; i < 100; i++ {
    wg.Add(1)
    go func() {
      runtime.LockOSThread()
      defer wg.Done()
      for j := 0; j < 100; j++ {
        net.LookupHost("www.baidu.com")
      }
    }()
  }
  wg.Wait()
  fmt.Println("创建协程之后的线程数量:", threadProfile.Count())
}
# 现在的
创建协程之前的线程数量: 6
创建协程之后的线程数量: 13
# 之前的
创建协程之前的线程数量: 6
创建协程之后的线程数量: 88

由于调用了 runtime.LockOSThread 函数的 G 没有执行 UnlockOSThread 函数,在 G 执行完毕后,M 也被终止了,空闲线程大量减少了

不过这个方法其实是存在隐患的,具体看issues,下面是截取的片段

Hi @superajun-wsj Not sure that it is good solution. When the child process is created by one thread called A with PdeathSignal: SIGKILL and the thread A becomes idle, if the thread A exits, the child process will receive KILL signal. So I think UnLockOSThread might introduce other issues. just my two cents.

总结

  在绝大多数情况下,我们的程序并不会遇到空闲线程数过多的问题。如果真的存在线程数暴涨的问题,那么你应该思考代码逻辑是否合理(为什么你能允许短时间内如此多的系统同步调用),是否可以做一些例如限流之类的处理。而不是想着通过 SetMaxThreads 方法来处理。


目录
相关文章
|
1月前
|
消息中间件 存储 算法
【软件设计师备考 专题 】操作系统的内核(中断控制)、进程、线程概念
【软件设计师备考 专题 】操作系统的内核(中断控制)、进程、线程概念
83 0
|
1月前
|
Java
线程池中的空余线程是如何被回收的
线程池中的空余线程是如何被回收的
31 1
|
2月前
|
Linux
操作系统 | 编写内核
操作系统 | 编写内核
44 0
|
2月前
|
C语言
操作系统 | 编写内核模块
操作系统 | 编写内核模块
34 1
|
1月前
|
算法 Linux 调度
根基已筑!Anolis OS 23.1 预览版本搭载 Linux 6.6 内核和工具链升级完成
Anolis OS 23.1 对软件包的选择和组合进行了重新规划与决策,满足更为广泛的应用场景需求。
|
1月前
|
Go 调度
|
2月前
|
Go 调度 开发者
Go语言并发基础:轻量级线程与通道通信
【2月更文挑战第6天】本文介绍了Go语言在并发编程方面的基础知识和核心概念。我们将深入探讨goroutine(轻量级线程)的创建与调度,以及如何利用channel进行goroutine间的通信与同步。此外,还将简要提及select语句的使用,并解释其在处理多个channel操作时的优势。
|
2月前
|
IDE Linux 开发工具
DP读书:鲲鹏处理器 架构与编程(十三)操作系统内核与云基础软件
DP读书:鲲鹏处理器 架构与编程(十三)操作系统内核与云基础软件
67 1
|
3月前
|
安全 Go 调度
Go 语言 Goroutine - 轻量级线程
Go 语言 Goroutine - 轻量级线程
20 0
|
3月前
|
Linux
Linux进程与线程的内核实现
task_struct称为进程描述符结构,该结构定义在文件中。进程描述符中包含一个具体进程的所有信息 进程描述符中包含的数据能完整地描述一个正在执行的程序:它打开的文件,进程的地址空间,挂起的信号,进程的状态等
38 0
Linux进程与线程的内核实现