GMP模型
含义
Goroutine 的并发编程模型基于GMP模型,其中基本含义如下:
-
G: 表示goroutine,每个goroutine都有自己的栈空间,定时器,初始化的栈空间在2k左右,空间会随着需求增长。
-
M: 抽象化代表为内核线程,记录内核线程栈信息,当goroutine调度到线程时,使用该goroutine自己的栈信息。
-
P: 为一个逻辑Processor,代表调度器,负责调度goroutine,维护一个本地goroutine队列,M从P上获得goroutine并执行,同时还负责部分呢内存的管理。
模型
全局队列: 存放等待允许的G。
P的本地队列: 同全局队列类似,存放的也是等待运行的G,存的数量有限,不超过256个。新建一个G时,G优先加入到P的本地队列,如果队列满了,则会把本地队列中一半的G移动到全局队列
P列表:所有的P都在程序启动时创建,并保存在数组中,最多有GOMAXPROCS个P
M:线程想运行任务就得获取P,从P的本地队列获取G,P队列为空的时候,M也会尝试从全局队列拿一批G放到P的本地队列,或从其他P的本地队列拿一半放到自己P的本地队列。M运行G,G执行之后,M会从P获取下一个G,不断重复下去。
M表示一个用户态线程,在M上有一个P和G,P是绑定到M上的,M获取G是通过P的调度获取的,在某一时刻,一个M上只有一个G(G0)除外。 在P上拥有一个G队列,里面是已经就绪的G,是可以被调度到线程栈上执行的协程,称为运行队列。
P和M的个数问题
1、 P的数量
由启动时环境变量$GOMAXPROCS 或者是由runtime 的方法GOMAXPROCS() 决定。这意味着在程序执行的任意时刻都只有$GOMAXPROCS 个Goroutine 在同时运行。
2、 M的数量
-
go语言本身的限制:go程序启动时,会设置M的最大数量,默认为10000。但是内核很难支持这么多的线程数,所以这个限制可以忽略。
-
runtime/debug 中的SetMaxThreads函数,设置M的最大数量
-
一个M阻塞了,会创建新的M
M与P的数量没有绝对关系,一个M阻塞,P就会去创建或者切换另一个M,所以,即使P的默认数量为1,也有可能创建很多个M出来。
调度器的设计策略
复用线程
避免频繁的创建、销毁线程,而是对线程的复用
-
work steaking 机制: 当本线程无可运行的G时,尝试从其他线程绑定的P偷取G,而不是销毁线程。
-
hand off 机制:当本线程因为G进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程执行。
并行利用
GOMAXPROCS设置P的数量,最多有GOMAXPROCS个线程分布在多个CPU上同时运行。GOMAXPROCS也限制了并发的程度,比如GOMAXPROCS=核心数/2, 则最多利用一半的CPI核进行并行。
抢占
在coroutine中要等待一个协程主动让出一个CPU才执行下一个协程,在Go中,一个goroutine最多占用CPU 10ms,防止其他goroutine饿死,这是goroutine 不同于别的coroutine的一个地方。
全局G队列
在最新的go语言中,存在一个全局G队列,但功能被弱化了,当M执行work stealing从其他P偷不到G时,它可以从全局G队列获取G。