揭秘系列:Goroutine调度器

系统 后端
你可能之前听说过Goroutine调度器,但我们真正了解它是如何工作的吗?它是如何将Goroutines与线程配对的?现在让我们一步一步地分解调度器的操作。

现在不要担心理解上面的图片,因为我们将从非常基础的知识开始。

Goroutines分布在线程中,由Goroutine调度器在幕后处理。根据我们之前的讨论,我们知道一些关于Goroutines的事情:

  • 从原始执行速度来看,Goroutines不一定比线程更快,因为它们需要一个实际的线程来运行。
  • Goroutines的真正优势在于上下文切换、内存占用、创建和拆除的成本等方面。

你可能之前听说过Goroutine调度器,但我们真正了解它是如何工作的吗?它是如何将Goroutines与线程配对的?

现在让我们一步一步地分解调度器的操作。

一、Goroutine的M:N调度器

Go团队为我们真正简化了并发处理,想想看:创建一个Goroutine就像在函数前面加上 go 关键字一样容易。

go doWork()

但在这个简单的步骤背后,有一个更深层的系统在运作。

从一开始,Go并不是简单地提供了线程。相反,在中间有一个辅助工具,Goroutine调度器,它是Go运行时的关键部分。

1*6UyqGhkbOV7kSlRe1CD-gA.png

那么什么是M:N标签?

它表示Go调度器在将M个Goroutines映射到N个内核线程时所起的作用,形成了M:N模型。你可以拥有更多的操作系统线程,就像可以拥有更多的Goroutines一样。

在我们深入研究调度器之前,让我们澄清一下经常混淆的两个术语:并发和并行。

  • 并发:这是关于同时处理多个任务,它们都在运动,但不总是在同一时刻。
  • 并行:这意味着许多任务在完全相同的时间运行,通常使用多个CPU核心。

1*30ViMAPkVySvdSDc-hI3sA.png

让我们看看Go调度器是如何与线程配合运作的。

二、PMG 模型

在我们深入研究内部工作原理之前,让我们分解一下P、M和G代表什么。

1.G(Goroutine)

Goroutine充当Go的最小执行单元,类似于轻量级线程。

在Go的运行时中,它由一个名为g的struct{}表示。一旦创建,它会找到一个逻辑处理器P的本地可运行队列(或G队列)中的位置,然后P将其交给一个实际的内核线程M。

Goroutines通常存在三种主要状态:

  • 等待:在这个阶段,Goroutine停滞不前,可能因为通道或锁之类的操作而暂停,或者可能被系统调用暂停。
  • 可运行:Goroutine已经准备好运行,但尚未开始运行,它正在等待轮到它在一个线程(M)上运行。
  • 运行:现在,Goroutine正在一个线程(M)上积极执行。它会一直执行,直到任务完成,除非调度器中断它或其他原因阻止了它的执行。

1*U62eyES6_koQtsv_9jWKHw.png

Goroutines并不仅仅被使用一次然后被丢弃。

相反,当启动新的Goroutine时,Go的运行时会从Goroutine池

中选择一个,但如果找不到任何可用的Goroutine,它会创建一个新的。然后,这个新的Goroutine加入到一个P的可运行队列中。

2.P(逻辑处理器)

在Go调度器中,当我们提到“处理器”时,我们指的是逻辑实体,而不是物理实体。

默认情况下,P的数量设置为可用的核心数,你可以使用runtime.GOMAXPROCS(int)函数来检查或更改这些处理器的数量。

runtime.GOMAXPROCS(0) // 获取当前允许的逻辑处理器数量

如果你想更改这个数量,最好是在应用程序启动时更改它,如果在运行时更改,它会导致STW(停止一切),直到重新调整处理器。

每个P都拥有自己的可运行Goroutines列表,称为本地运行队列,最多可以容纳256个Goroutines。

1*0EneA397HA1uYYeg0_HspQ.png

调度器 — P(逻辑处理器)

如果P的队列达到了最大Coroutines数(256),那么就有一个共享队列,称为全局运行队列,但我们将稍后讨论这个。

"那么 'P' 的这个数量到底代表什么?" 它表示可以同时运行的Goroutines数量 — 想象它们并行运行。

3.M(机器线程 — 操作系统线程)

一个典型的Go程序最多可以使用1万个线程。

是的,我说的是线程,而不是Goroutines。如果超出这个限制,你可能会使你的Go应用程序崩溃。

"什么情况下会创建一个线程?" 想象一种情况:一个Goroutine处于可运行状态并需要一个线程。如果所有线程已经被阻塞,可能是因为系统调用或非抢占操作,会怎么样?在这种情况下,调度器会介入并为该Goroutine创建一个新线程。一个需要注意的事情是,如果一个线程只是忙于昂贵的计算或长时间运行的任务,它不被视为被卡住或被阻塞。如果你想更改默认线程限制,你可以使用 runtime/debug.SetMaxThreads() 函数,它允许你设置你的Go程序可以使用的操作系统线程的最大数量。此外,值得知道的是,线程是可以重复使用的,因为创建或销毁线程是消耗资源的。

三、MPG 工作原理

让我们通过项目符号逐步了解 M、P 和 G 如何一起运作。

我不会在这里深入讨论每个细节,但我将在即将发布的故事中深入探讨。如果你感兴趣,请订阅。

1*d4hu416FJtHHaJaKJFYkGg.png

1.Go Scheduler 的工作原理:

  • 初始化 goroutine:通过使用 go func() 命令,Go Runtime 要么创建一个新的 goroutine,要么从池中选择一个现有的。
  • 排队位置:goroutine 寻找其在队列中的位置,如果所有逻辑处理器(P)的本地队列都满了,那么这个 goroutine 就被放入全局队列。
  • 线程配对:这是 M 开始发挥作用的地方。它获取一个 P 并开始处理来自 P 本地队列的 goroutine,当 M 与这个 goroutine 交互时,与之关联的 P 就变得占用,不再可用于其他 M。
  • 窃取行为:如果某个 P 的队列被耗尽,M 会尝试“借用”另一个 P 队列中一半可运行的 goroutine。如果不成功,它然后检查全局队列,然后再检查网络轮询器(请查看下面的“窃取过程”图表部分)。
  • 资源分配:M 选择了一个 goroutine(G)之后,它会获取运行 G 所需的所有资源。“那么被阻塞的线程呢?” 如果一个 goroutine 启动了需要时间的系统调用(比如读取文件),那么 M 会等待。但调度程序不喜欢某个只是坐在那里等待的线程,它会将被暂停的 M 与其 P 解除连接,并将来自队列的另一个可运行的 goroutine 与新的或现有的 M 连接起来,然后与 P 协作。

2.被阻塞的线程

窃取过程:

当一个线程(M)完成了它的任务并没有其他事情可做时,它不会坐在那里。

相反,它积极地寻找更多工作,观察其他处理器并获取它们一半的任务,让我们来详细了解一下:

ewA.png

  • 每 61 个时钟滴答,M 检查全局可运行队列,以确保执行的公平性。如果在全局队列中找到一个可运行的 goroutine,就停止。
  • 然后,线程 M 检查其本地运行队列,与其处理器 P 相关联,以查看是否有可运行的 goroutine 可以处理。
  • 如果线程发现它的队列是空的,那么它会查看全局队列,看看那里是否有等待处理的任务。
  • 然后,线程会检查网络轮询器,以查看是否有与网络相关的任务。
  • 如果线程在检查了网络轮询器后仍然没有找到任务,它将进入主动搜索模式,我们可以将其视为旋转状态。
  • 在这种状态下,线程试图从其他处理器的队列中“借用”任务。
  • 经过所有这些步骤后,如果线程仍然找不到工作,它将停止主动搜索。
  • 现在,如果有新的任务进来,而且有一个没有在搜索状态的空闲处理器,那么可以提示另一个线程开始工作。

需要注意的细节是全局队列实际上被检查了两次:每 61 个时钟滴答一次以确保公平性,如果本地队列为空,就再次检查。

“如果 M 与其 P 相关联,它怎么能从其他处理器那里获取任务呢?M 会更改其 P 吗?” 答案是不会。即使 M 从另一个 P 的队列中获取任务,它仍然使用其原始处理器来运行该任务。因此,在 M 承担新任务的同时,它仍然忠实于其处理器。

“为什么是 61?” 在设计算法时,特别是哈希算法,通常会选择质数,因为它们除了 1 和它们自己之外没有除数。这可以降低出现模式或规律的机会,从而防止“碰撞”或其他不希望出现的行为。如果太短,系统可能会浪费资源频繁检查全局运行队列。如果太长,goroutine 可能会在执行之前等待过长的时间。

3.网络轮询器

我们还没有详细讨论网络轮询器,但它在窃取过程图表中提到了。

与 Go Scheduler 一样,网络轮询器是 Go Runtime 的组成部分,负责处理与网络相关的调用(例如,网络 I/O)。

让我们比较两种系统调用类型:

  • 与网络相关的系统调用:当一个 goroutine 执行网络 I/O 操作时,它不会阻塞线程,而是会在网络轮询器中注册。轮询器会异步等待操作完成,一旦完成,goroutine 就会再次可运行,可以在一个线程上继续执行。
  • 其他系统调用:如果它们可能会阻塞并且不由网络轮询器处理,它们可能会导致 goroutine 将其执行卸载到操作系统线程上。只有特定的操作系统线程会被阻塞,Go 运行时调度程序可以在不同线程上执行其他 goroutine。
责任编辑:赵宁宁 来源: 小技术君
相关推荐

2025-01-15 09:13:53

2010-04-23 09:30:18

国产龙芯服务器

2022-02-15 18:45:35

Linux进程调度器

2023-11-22 13:18:02

Linux调度

2024-10-29 08:52:01

Go协作式调度

2023-03-03 15:37:32

GMP 模型goroutine

2021-03-12 08:53:09

GC调度Goroutine

2023-12-13 13:03:53

任务调度执行XXLJOB

2018-03-14 09:44:56

阿里容器平台

2011-01-21 07:36:00

LinuxBFSCFS

2021-01-29 08:22:03

调度器Yarn架构

2023-04-17 08:13:13

KubernetesPod

2011-01-13 13:59:14

2013-03-08 10:07:20

GO语言Goroutine

2022-02-18 15:07:29

goroutinepanic协程

2022-07-12 10:38:25

分布式框架

2019-01-10 11:12:15

Nginx服务器架构

2010-06-04 09:42:23

MySQL 事件调度器

2021-10-11 08:58:34

Goroutine操作系统

2021-08-10 07:41:24

ContextWaitGroupGoroutine
点赞
收藏

51CTO技术栈公众号