图解:进程怎么绑定 CPU

系统 Linux
昨天在群里有朋友问:把进程绑定到某个 CPU 上运行是怎么实现的。首先,我们先来了解下将进程与 CPU 进行绑定的好处。

 

昨天在群里有朋友问:把进程绑定到某个 CPU 上运行是怎么实现的。

首先,我们先来了解下将进程与 CPU 进行绑定的好处。

进程绑定 CPU 的好处:在多核 CPU 结构中,每个核心有各自的L1、L2缓存,而L3缓存是共用的。如果一个进程在核心间来回切换,各个核心的缓存命中率就会受到影响。相反如果进程不管如何调度,都始终可以在一个核心上执行,那么其数据的L1、L2 缓存的命中率可以显著提高。

所以,将进程与 CPU 进行绑定可以提高 CPU 缓存的命中率,从而提高性能。而进程与 CPU 绑定被称为:CPU 亲和性。

设置进程的 CPU 亲和性

前面介绍了进程与 CPU 绑定的好处后,现在来介绍一下在 Linux 系统下怎么将进程与 CPU 进行绑定的(也就是设置进程的 CPU 亲和性)。

Linux 系统提供了一个名为 sched_setaffinity 的系统调用,此系统调用可以设置进程的 CPU 亲和性。我们来看看 sched_setaffinity 系统调用的原型: 

  1. int sched_setaffinity(pid_t pid, size_t cpusetsize, const cpu_set_t *mask); 

下面介绍一下 sched_setaffinity 系统调用各个参数的作用:

  •  pid:进程ID,也就是要进行绑定 CPU 的进程ID。
  •  cpusetsize:mask 参数所指向的 CPU 集合的大小。
  •  mask:与进程进行绑定的 CPU 集合(由于一个进程可以绑定到多个 CPU 上运行)。

参数 mask 的类型为 cpu_set_t,而 cpu_set_t 是一个位图,位图的每个位表示一个 CPU,如下图所示:

例如,将 cpu_set_t 的第0位设置为1,表示将进程绑定到 CPU0 上运行,当然我们可以将进程绑定到多个 CPU 上运行。

我们通过一个例子来介绍怎么通过 sched_setaffinity 系统调用来设置进程的 CPU 亲和性: 

  1. #define _GNU_SOURCE  
  2. #include <sched.h>  
  3. #include <stdio.h>  
  4. #include <string.h>  
  5. #include <stdlib.h>  
  6. #include <unistd.h>  
  7. #include <errno.h>  
  8. int main(int argc, char **argv)  
  9.  
  10.     cpu_set_t cpuset;  
  11.     CPU_ZERO(&cpuset);    // 初始化CPU集合,将 cpuset 置为空  
  12.     CPU_SET(2, &cpuset);  // 将本进程绑定到 CPU2 上  
  13.     // 设置进程的 CPU 亲和性  
  14.     if (sched_setaffinity(0, sizeof(cpuset), &cpuset) == -1) {  
  15.         printf("Set CPU affinity failed, error: %s\n", strerror(errno)); 
  16.          return -1;   
  17.     }  
  18.     return 0;  

CPU 亲和性实现

知道怎么设置进程的 CPU 亲和性后,现在我们来分析一下 Linux 内核是怎样实现 CPU 亲和性功能的。

本文使用的 Linux 内核版本为 2.6.23

Linux 内核为每个 CPU 定义了一个类型为 struct rq 的 可运行的进程队列,也就是说,每个 CPU 都拥有一个独立的可运行进程队列。

一般来说,CPU 只会从属于自己的可运行进程队列中选择一个进程来运行。也就是说,CPU0 只会从属于 CPU0 的可运行队列中选择一个进程来运行,而绝不会从 CPU1 的可运行队列中获取。

所以,从上面的信息中可以分析出,要将进程绑定到某个 CPU 上运行,只需要将进程放置到其所属的 可运行进程队列 中即可。

下面我们来分析一下 sched_setaffinity 系统调用的实现,sched_setaffinity 系统调用的调用链如下: 

  1. sys_sched_setaffinity()  
  2. └→ sched_setaffinity()  
  3.    └→ set_cpus_allowed()  
  4.       └→ migrate_task() 

从上面的调用链可以看出,sched_setaffinity 系统调用最终会调用 migrate_task 函数来完成进程与 CPU 进行绑定的工作,我们来分析一下 migrate_task 函数的实现: 

  1. static int  
  2. migrate_task(struct task_struct *p, int dest_cpu, struct migration_req *req)  
  3.  
  4.     struct rq *rq = task_rq(p);  
  5.     // 情况1:  
  6.     // 如果进程还没有在任何运行队列中  
  7.     // 那么只需要将进程的 cpu 字段设置为 dest_cpu 即可  
  8.     if (!p->se.on_rq && !task_running(rq, p)) {  
  9.         set_task_cpu(p, dest_cpu);  
  10.         return 0;  
  11.     }  
  12.     // 情况2:  
  13.     // 如果进程已经在某一个 CPU 的可运行队列中 
  14.     // 那么需要将进程从之前的 CPU 可运行队列中迁移到新的 CPU 可运行队列中  
  15.     // 这个迁移过程由 migration_thread 内核线程完成  
  16.     // 构建进程迁移请求 
  17.     init_completion(&req->done);  
  18.     req->task = p 
  19.     req->dest_cpudest_cpu = dest_cpu;  
  20.     list_add(&req->list, &rq->migration_queue);  
  21.     return 1;  

我们先来介绍一下 migrate_task 函数各个参数的意义:

  •  p:要设置 CPU 亲和性的进程描述符。
  •  dest_cpu:绑定的 CPU 编号。
  •  req:进程迁移请求对象(下面会介绍)。

所以,migrate_task 函数的作用就是将进程描述符为 p 的进程绑定到编号为 dest_cpu 的目标 CPU 上。

migrate_task 函数主要分两种情况来将进程绑定到某个 CPU 上:

  •  情况1:如果进程还没有在任何 CPU 的可运行队列中(不可运行状态),那么只需要将进程描述符的 cpu 字段设置为 dest_cpu 即可。当进程变为可运行时,会根据进程描述符的 cpu 字段来自动放置到对应的 CPU 可运行队列中。
  •  情况2:如果进程已经在某个 CPU 的可运行队列中,那么需要将进程从之前的 CPU 可运行队列中迁移到新的 CPU 可运行队列中。迁移过程由 migration_thread 内核线程完成,migrate_task 函数只是构建一个进程迁移请求,并通知 migration_thread 内核线程有新的迁移请求需要处理。

而进程迁移过程由 __migrate_task 函数完成,我们来看看 __migrate_task 函数的实现: 

  1. static int   
  2. __migrate_task(struct task_struct *p, int src_cpu, int dest_cpu)  
  3.  
  4.     struct rq *rq_dest, *rq_src;  
  5.     int ret = 0, on_rq;  
  6.     ...  
  7.     rq_src = cpu_rq(src_cpu);    // 进程所在的原可运行队列  
  8.     rq_dest = cpu_rq(dest_cpu);  // 进程希望放置的目标可运行队列  
  9.     ...  
  10.     on_rq = p->se.on_rq;  // 进程是否在可运行队列中(可运行状态)  
  11.     if (on_rq)  
  12.         deactivate_task(rq_src, p, 0);  // 把进程从原来的可运行队列中删除  
  13.     set_task_cpu(p, dest_cpu);  
  14.     if (on_rq) {  
  15.         activate_task(rq_dest, p, 0);   // 把进程放置到目标可运行队列中  
  16.         ...  
  17.     }  
  18.     ...  
  19.     return ret; 
  20.  

__migrate_task 函数主要完成以下两个工作:

  •  把进程从原来的可运行队列中删除。
  •  把进程放置到目标可运行队列中。

其工作过程如下图所示(将进程从 CPU0 的可运行队列迁移到 CPU3 的可运行队列中):

如上图所示,进程原本在 CPU0 的可运行队列中,但由于重新将进程绑定到 CPU3,所以需要将进程从 CPU0 的可运行队列迁移到 CPU3 的可运行中。

迁移过程首先将进程从 CPU0 的可运行队列中删除,然后再将进程插入到 CPU3 的可运行队列中。

当 CPU 要运行进程时,首先从它所属的可运行队列中挑选一个进程,并将此进程调度到 CPU 中运行。

总结

从上面的分析可知,其实将进程绑定到某个 CPU 只是将进程放置到 CPU 的可运行队列中。

由于每个 CPU 都有一个可运行队列,所以就有可能会出现 CPU 间可运行队列负载不均衡问题。如 CPU0 可运行队列中的进程比 CPU1 可运行队列多非常多,从而导致 CPU0 的负载非常高,而 CPU1 负载非常低的情况。

当出现上述情况时,就需要对 CPU 间的可运行队列进行重平衡操作,有兴趣的可以自行阅读源码或参考相关资料。 

 

责任编辑:庞桂玉 来源: 良许Linux
相关推荐

2010-07-21 09:32:03

Linux多核

2021-10-17 19:49:52

CPURedis缓存

2023-04-12 15:37:31

Linux系统CPU

2021-02-22 07:58:45

算法进程调度

2017-02-16 19:39:29

Windows 10System进程CPU

2021-06-15 08:02:55

Linux 进程管理

2022-01-10 17:41:31

内存结构PostgreSQL

2021-09-30 10:45:33

Linux进程通信

2021-07-15 08:00:47

系统性能调优cpunuma架构

2010-11-26 09:25:28

2021-06-30 21:13:49

CPUCache数据

2009-06-17 09:06:59

Unix系统资源进程

2021-04-20 13:40:56

Epoll IO

2020-10-12 14:18:15

CPU技巧代码

2020-08-03 14:17:34

CPU内存系统运维

2013-12-17 10:26:14

Windows XPSVCHOST

2019-09-10 08:13:33

LinuxCPU内存

2021-09-14 10:21:13

CPU高性能服务器

2019-12-16 09:10:38

Linux中央处理器进程

2019-12-16 11:00:04

LinuxCPU进程
点赞
收藏

51CTO技术栈公众号