玩透Linux信号机制-51CTO.COM

1.信号处理函数

如果我们想捕捉进程的这两个信号：SIGCHLD、SIGCONT，用到函数sigaction

图片

Linux内核提供了多少种信号呢？shell终端运行shell -l即可看到，64种。我们代码中捕捉的两个信号，分别是17号、18号信号，这两个数字记一下，等下查看内核数据能看到

图片

先在内核中找到我们注册的信号处理函数，再说底层实现原理。这个你得自己写内核驱动程序，市面上没有任何工具可以让你看

图片

找到了。再确定一下我们通过函数sigaction注册的信号处理函数地址是不是这两个，一毛一样

图片

接下来说说Linux内核是如何存储我们注册的信号处理函数

struct task_struct {
    struct sighand_struct		*sighand;
    ……
}

struct sighand_struct {
	spinlock_t		siglock;
	refcount_t		count;
	wait_queue_head_t	signalfd_wqh;
	struct k_sigaction	action[_NSIG];
};

struct k_sigaction {
	struct sigaction sa;
#ifdef __ARCH_HAS_KA_RESTORER
	__sigrestore_t ka_restorer;
#endif
};

struct sigaction {
#ifndef __ARCH_HAS_IRIX_SIGACTION
	__sighandler_t	sa_handler;
	unsigned long	sa_flags;
#else
	unsigned int	sa_flags;
	__sighandler_t	sa_handler;
#endif
#ifdef __ARCH_HAS_SA_RESTORER
	__sigrestore_t sa_restorer;
#endif
	sigset_t	sa_mask;	/* mask last for extensibility */
};1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.

Linux内核中，每个进程对应一个task_struct实例，里面有个属性sighand就是用来存储你使用函数sigaction注册的信号处理函数，具体存储在sighand_struct的action数组中，数组的索引就是信号的编号：1-64，数组的值是k_sigaction实例，真正存放信号处理函数的地方是sigaction.sa_handler

所以如果你想查看Linux内核中，某个进程注册的所有信号处理函数，代码这样写即可

图片

至此，我们写代码注册的信号处理函数，在内核中如何存储的，就彻底搞明白了。那内核是何时、怎么调用这个函数的呢？接着走……

2.kill-18

比如我们通过kill -18向进程18226发送信号，中间发生了什么？我就不贴源码了，直接单步调试内核，贴调用栈吧

图片

这里看到的只是内核态的调用栈，用户态的，kill命令底层调用的就是glibc库中的kill函数，而kill函数则是通过syscall+kill的内核调用号，进入内核，调用相关函数

图片

关于用户态切内核态，CPU提供了四个门、两个快速调用，以前的实现方式是0x80中断门，现在都是走syscall快速调用。如果你非科班，或者没学过操作系统，应该没听过这个，或者对这个没概念。建议非科班出身的小伙伴，一定要把操作系统补一下

那这个信号在内核中是如何存储的呢？核心逻辑在send_signal中，我就不贴代码了，直接说它做了什么吧

struct task_struct {
    struct signal_struct		*signal;
    sigset_t			blocked;
    ……
}

struct signal_struct {
    /* shared signal handling: */
	struct sigpending	shared_pending;
    ……
}

struct sigpending {
	struct list_head list;
	sigset_t signal;
};

struct sigqueue {
	struct list_head list;
	int flags;
	kernel_siginfo_t info;
	struct user_struct *user;
};1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.

进入内核的时候，信号会被包装成kernel_siginfo

图片

真正与进程关联起来的步骤是，将kernel_siginfo再包装成sigqueue，然后将sigqueue实例挂到sigpending中，进程结构体task_struct中有个属性shared_pending就是链表头，有点抽象，看图

图片

顺便说一下，Linux内核中的64种信号分成两个阵营：可靠信号与不可靠信号，可靠信号又叫实时信号，不可靠信号又叫非实时信号

图片

实时与非实时，表达的不是立刻去做的意思，是指信号不会丢失。这名字起的真让人容易产生误解。Linux内核中的很多函数名也是，比如get_signal，它里面做了很多重要的事情，我看代码的时候以为就是去信息相关信息

嗯，差不多就这些。至此，信号在内核中是如何存储的就清晰了。那进程何时处理信号，Linux内核是如何设计的呢？

3.信号处理

如果这块由你来设计，你会怎么做？不知道？好吧……

Linux内核是如何设计的呢？它的设计是在进程由内核态返回用户态的路径上实现的。为什么要这么做呢？

因为要兼容运行用户态注册的信号处理函数，这个节点是最优选择。反正都要进入用户态执行，在这之前，顺便把信号处理函数执行了。这里要怎么实现呢？改线程栈结构，你如果学了我讲的汇编，你就知道要怎么改了。

同样，不贴代码了，直接单步调试Linux内核看吧！

图片

函数do_signal就是信号处理的核心函数

接下来详细分析代码层面实现，如果你不会汇编，你可能就看不懂了

4.执行信号处理函数

什么时候CPU会由用户态进入内核态呢？发生中断、异常，还有比较常见的：系统调用。比如write函数

图片

当CPU执行syscall指令，CPU就进入Linux内核中了，这时候用户态的栈比如是这样（我就画关键信息了哦）

图片

如果有信号需要处理的时候，这时候用户又设置了信号处理函数，那内核在回用户态前会把栈改成这样

图片

会把rcx设置为信号处理函数的地址，syscall进入内核，配套的返回指令是sysret，会返回到rcx中内存地址的位置执行代码。所有的函数的最后一条指令都是ret，会pop出栈顶元素，并跳转到那个内存地址开始执行代码。

syscall进入内核，把该干的事情干完，就执行sysret返回用户态。返回到哪里？rcx中内存地址的位置，这个位置就是信号处理函数。执行完信号处理函数，pop出栈底元素，跳过去，这个位置就是CPU执行syscall进入内核后面的哪一行代码的内存地址，从而实现接着执行。这样就完成了进入用户态，顺便执行信号处理函数的动作。怎么样，是不是特别有智慧！