【译文】原文地址
本文是基于Go 1.13版本
创建一个操作系统线程或从一个线程切换到另一个线程,对程序来说在内存和性能方面是代价很大的。Go为了充分利用cpu核的优势,在一开始就考虑了并发性。
M, P, G组合
为了解决性能问题,Go有自己的调度器来分配goroutine到线程上去。该调度器定义了三个主要概念,就如代码中所表示的:
G-指的是goroutine
M-工作线程,或者机器
P-处理器,执行代码需要的资源。M必须有相应的P才能运行代码。
如下是M, P, G模型图:
每个goroutine(G)运行在一个OS线程上,这个线程会被分配到一个逻辑CPU(P)。通过一个例子来看下Go如何管理它们的:
package main
import "sync"
func main() {
var wg sync.WaitGroup
wg.Add(2)
go func() {
println(`hello`)
wg.Done()
}()
go func() {
println(`world`)
wg.Done()
}()
wg.Wait()
}
Go首先将根据机器的逻辑cpu个数来创建不同的P,并存放在一个空闲的P列表中:
然后,新的一个goroutine或多个goroutine将唤醒P来更好的分配工作。这个P将创建一个与操作系统线程相关的M:
然而,空闲的P和M-即没有等待执行的goroutine,从系统调用中返回或甚至被垃圾收集器强制停止,将进入空闲队列中:
在程序的启动过程中,Go已经创建了一些OS线程和相关的M。在以上例子中,第一个输出hello的goroutine将使用main goroutine,而第二个goroutine将从空闲列表中获取一个M和P:
以上我们看到了goroutine和线程的管理,下面看下在什么情况下Go会使用更多的M而不是P以及在系统调用下goroutine是如何管理的。
系统调用
Go优化系统调用的方法是通过在运行时对其进行包装,无论系统调用是否阻塞。这个包装器将自动将P和线程M分离,并允许其他线程在其上运行。让我们举一个读取文件的例子:
package main
import (
"os"
)
func main() {
buf := make([]byte, 0, 2)
fd, _ := os.Open("main.go")
fd.Read(buf)
fd.Close()
println(string(buf)) // 42
}
下面是文件打开的工作流程:
P0进入空闲队列,可供其他线程使用。一旦系统调用退出,Go将应用如下满足条件的规则:
- 尝试获取对应的P,本例中的p0,并继续执行。
- 尝试从空闲列表中获取一个新的P,恢复执行。
- 将正在执行的goroutine放入全局队列,并将对于的M放回空闲队列。
然而,Go也可以处理资源尚未就绪的情况,比如http调用这种非阻塞I/O情况。在这种情况下,第一个系统调用(遵循前面的共工作流程)因为资源未就绪将调用不成功,迫使Go使用网络轮询并使goroutine驻留。
func main() {
http.Get(`https://httpstat.us/200`)
}
一旦第一个系统调用完成并显示资源未就绪,对应的goroutine就会驻留,直到网络轮询通知资源就绪。在这种情况下,线程M将不会被阻塞:
当Go调度器寻找工作时,对应的goroutine将再次运行。然后调度器将询问网络轮询器,是否有等待就绪的gorotine需要执行。
如果就绪的goroutine不止一个的话,多出的goroutine将进入全局可执行队列等待调度。
操作系统线程约束
当使用系统调用时,Go不限制被阻塞的操作系统线程数量,如下所述:
GOMAXPROCS变量限制了能够同时执行用户态Go代码的操作系统线程数量。但并没有对Go代码中处于阻塞状态下系统调用的线程数量有限制。这些系统调用线程数量不会受影响。
以下就是这种情况的一个例子:
package main
import (
"fmt"
"net/http"
"sync"
)
func main() {
var wg sync.WaitGroup
for i := 0;i < 100 ;i++ {
wg.Add(1)
go func(i int) {
http.Get(`https://www.baidu.com`)
fmt.Println(i)
wg.Done()
}(i)
}
wg.Wait()
}
如下是跟踪工具查看到的线程个数:
因为Go优化了线程的使用,当goroutine被阻塞时线程会被复用,这就解释了为什么这个线程数和循环数量不一致。