在谈goroutine之前,我们先谈谈并发和并行。
一般的程序,如果没有特别要求的话,是顺序执行的,这样的程序也容易编写维护。但是随着科技的发展、业务的演进,我们不得不变写可以并行的程序,因为这样有很多好处。
比如你在看文章的时候,还可以听着音乐,这就是系统的并行,同时可以做多件事情,充分地利用计算机的多核,提升软件运行的性能。
在操作系统中,有两个重要的概念:一个是进程、一个是线程。当我们运行一个程序的时候,比如你的IDE或者QQ等,操作系统会为这个程序创建一个进程,这个进程包含了运行这个程序所需的各种资源,可以说它是一个容器,是属于这个程序的工作空间,比如它里面有内存空间、文件句柄、设备和线程等。
那么线程是什么呢?线程是一个执行的空间,比如要下载一个文件,访问一次网络等。线程会被操作系统调用,来在不同的处理器上运行编写的代码任务,这个处理器不一定是该程序进程所在的处理。操作系统的调度是操作系统负责的,不同的操作系统可能会不一样,但是对于我们程序编写者来说,不用关心,因为对我们都是透明的。
一个进程在启动的时候,会创建一个主线程,这个主线程结束的时候,程序进程也就终止了,所以一个进程至少有一个线程。这也是我们在main函数里,使用goroutine的时候,要让主线程等待的原因,因为主线程结束了,程序就终止了,那么就有可能会看不到goroutine的输出。
Go语言中并发指的是让某个函数独立于其他函数运行的能力,一个goroutine就是一个独立的工作单元,Go的runtime(运行时)会在逻辑处理器上调度这些goroutine来运行,一个逻辑处理器绑定一个操作系统线程,所以说goroutine不是线程,它是一个协程,也是这个原因,它是由Go语言运行时本身的算法实现的。
这里我们总结下几个概念:
概念 |
说明 |
---|---|
进程 |
一个程序对应一个独立程序空间 |
线程 |
一个执行空间,一个进程可以有多个线程 |
逻辑处理器 |
执行创建的goroutine,绑定一个线程 |
调度器 |
Go运行时中的,分配goroutine给不同的逻辑处理器 |
全局运行队列 |
所有刚创建的goroutine都会放到这里 |
本地运行队列 |
逻辑处理器的goroutine队列 |
当我们创建一个goroutine后,会先存放在全局运行队列
中,等待Go运行时的调度器
进行调度。把他们分配给其中的一个逻辑处理器
,并放到这个逻辑处理器对应的本地运行队列
中,最终等着被逻辑处理器
执行即可。
这一套管理、调度、执行goroutine的方式称之为Go的并发。并发可以同时做很多事情,比如有个goroutine执行了一半,就被暂停执行其他goroutine去了,这是Go控制管理的。所以并发的概念和并行不一样,并行指的是在不同的物理处理器上同时执行不同的代码片段,并行可以同时做很多事情;并发是同时管理很多事情,因为操作系统和硬件的总资源比较少,所以并发的效果要比并行好的多,使用较少的资源做更多的事情,也是Go语言提倡的。
Go的并发原理我们刚刚讲了,那么Go的并行是怎样的呢?其实答案非常简单,多创建一个逻辑处理器
就好了,这样调度器就可以同时分配全局运行队列
中的goroutine到不同的逻辑处理器
上并行执行。
func main() { var wg sync.WaitGroup wg.Add(2) go func(){ defer wg.Done() for i:=1;i<100;i++ { fmt.Println("A:",i) } }() go func(){ defer wg.Done() for i:=1;i<100;i++ { fmt.Println("B:",i) } }() wg.Wait() }
这是一个简单的并发程序。创建一个goroutine是通过go
关键字的,其后跟一个函数或者方法即可。
这里的sync.WaitGroup
其实是一个计数的信号量,使用它的目的是要main
函数等待两个goroutine执行完成后再结束,不然这两个goroutine
还在运行的时候,程序就结束了,看不到想要的结果。
sync.WaitGroup
的使用也非常简单,先是使用Add
方法设置计算器为 2 ,每一个goroutine的函数执行完之后,就调用Done
方法减 1 。Wait
方法的意思是如果计数器大于 0 ,就会阻塞,所以main
函数会一直等待两个goroutine完成后,再结束。
我们运行这个程序,发现A和B前缀会交叉出现,并且每次运行的结果可能不一样,这就是Go调度器调度的结果。
默认情况下,Go默认是给每个可用的物理处理器都分配一个逻辑处理器,因为我的电脑是 4 核的,所以上面的例子默认创建了 4 个逻辑处理器,所以这个例子中同时也有并行的调度,如果我们强制只使用一个逻辑处理器,我们再看看结果。
func main() { runtime.GOMAXPROCS(1) var wg sync.WaitGroup wg.Add(2) go func(){ defer wg.Done() for i:=1;i<100;i++ { fmt.Println("A:",i) } }() go func(){ defer wg.Done() for i:=1;i<100;i++ { fmt.Println("B:",i) } }() wg.Wait() }
设置逻辑处理器个数也非常简单,在程序开头使用runtime.GOMAXPROCS(1)
即可,这里设置的数量是 1 。我们这时候再运行,会发现先打印A,再打印B。
这里我们不要误认为是顺序执行,这里之所以顺序输出的原因,是因为我们的goroutine执行时间太短暂了,还没来得及切换到第 2 个goroutine,第 1 个goroutine就完成了。这里我们可以把每个goroutine的执行时间拉长一些,就可以看到并发的效果了,这里不再示例了,大家自己试试。
对于逻辑处理器的个数,不是越多越好,要根据电脑的实际物理核数。如果不是多核的,设置再多的逻辑处理器个数也没用。如果需要设置的话,一般我们采用如下代码设置。
runtime.GOMAXPROCS(runtime.NumCPU())
所以对于并发来说,就是Go语言本身自己实现的调度;对于并行来说,是和运行的电脑的物理处理器的核数有关的,多核就可以并行并发,单核只能并发了。