Linux系统编程—时序竞态

系统 Linux
什么是时序竞态?将同一个程序执行两次,正常情况下,前后两次执行得到的结果应该是一样的。但由于系统资源竞争的原因,前后两次执行的结果有可能得到不一样的结果,这个现象就是时序竞态。

##时序竞态

什么是时序竞态?将同一个程序执行两次,正常情况下,前后两次执行得到的结果应该是一样的。但由于系统资源竞争的原因,前后两次执行的结果有可能得到不一样的结果,这个现象就是时序竞态。

[[344854]]

##pause函数

函数原型:

  1. int pause(void); 

函数作用:

进程调用pause函数时,会造成进程主动挂起(处于阻塞状态,并主动放弃CPU),并且等待信号将其唤醒。

返回值:

我们知道,信号的处理方式有三种:1. 默认动作;2. 忽略处理;3. 捕捉。进程收到一个信号后,会先处理响应信号,再唤醒pause函数。于是有下面几种情况:

  • 如果信号的默认处理动作是终止进程,则进程将被终止,也就是说一收到信号进程就终止了,pause函数根本就没有机会返回;
  • 如果信号的默认处理动作是忽略,则进程将直接忽略该信号,相当于没收到这个信号,进程继续处于挂起状态,pause函数不返回;
  • 如果信号的处理动作是捕捉,则进程调用完信号处理函数之后,pause返回-1,errno设置为EINTR,表示“被信号中断”。
  • pause收到的信号不能被屏蔽,如果被屏蔽,那么pause就不能被唤醒。

因为alarm函数可以在设定的时间之后发送SIGALRM信号,pause函数又可以将进程挂起等待信号,则二者结合可以自己写一个sleep函数,如下:

  1.  #include <unistd.h> 
  2.  #include <signal.h> 
  3.  #include <stdio.h> 
  4.   
  5.  void sig_alrm(int signo) 
  6.  { 
  7.      /* nothing to do */ 
  8.  } 
  9.   
  10. unsigned int mysleep(unsigned int nsecs) 
  11.     unsigned int unslept; 
  12.  
  13.     signal(SIGALRM, &sig_alrm); 
  14.     unslept = alarm(nsecs);  
  15.     pause(); 
  16.  
  17.     return unslept; 
  18.  
  19.  
  20. int main(void) 
  21.     while(1){ 
  22.         mysleep(2); 
  23.         printf("Two seconds passed\n"); 
  24.     } 
  25.  
  26.     return 0; 

##时序竞态前导例

在讲时序竞态具体现象之前,我们先来看一个生活中常见的场景:

想午睡10分钟,于是定了个10分钟的闹钟,希望10分钟后闹钟将自己叫醒。

正常情况:定好闹钟,午睡,10分钟后闹钟叫醒自己;

异常情况:定好闹钟,躺下睡觉2分钟,被同学叫醒去打球,打了20分钟后回来继续睡觉。但在打球期间,闹钟早就响过了,将不会再唤醒自己。

这个例子与之后要讲的时序竞态有很大的相似之处。

##时序竞态问题分析

我们再回过头来看上面所写的mysleep程序。这个函数有可能是下面的时序:

  • SIGALRM默认动作是终止进程,因此我们要将其捕捉,对SIGALRM注册信号处理函数;
  • 调用alarm(1)函数定时1秒钟;
  • alarm(1)调用结束,定时器开始计时。就在这时,进程失去CPU,进入就绪态等待CPU(相当于被同学叫醒去打球)。失去CPU的方式有可能是内核调度了优先级更高的进程取代了当前进程,使得当前进程无法获得CPU;
  • 我们知道,alarm函数如果采用自然定时法的话,定时器将一直计时,与进程状态无关。于是,1秒后,闹钟定时时间到,内核向当前进程发送SIGALRM信号。高优先级进程尚未执行完毕,当前进程仍然无法获得CPU,继续处于就绪态,信号无法处理(处于未决状态);
  • 优先级高的进程执行完毕,当前进程获得CPU资源,内核调度回当前进程执行。SIGALRM信号递达,并被进程处理;
  • 信号处理完毕后,返回当前主控流程,并调用pause()函数,挂起等待alarm函数发送的SIGALRM信号将自己唤醒;
  • 但实际SIGALRM信号已经处理完毕,pause()函数永远不会等到。

##解决时序竞态问题

通过以上时序分析,我们可以看出,造成时序竞态的原因就是SIGALRM信号在进程失去CPU的时候就已经发送过来。为了防止这个现象出现,我们可以先将该信号阻塞,将其“抓住”,再在解除阻塞的时候立刻调用pause函数挂起等待。这样即使在调用alarm就失去CPU,也可以在进程重新获得CPU时将抓到的SIGALRM信号重新“放出来”,并将之后的pause函数唤醒。

但在解除阻塞与pause等待挂起信号之间,还是有可能失去CPU,除非将这两个步骤做成一个“原子操作”。Linux系统提供的sigsuspend函数就具备这个功能。所以,在时序要求比较严格的场合下都应该使用sigsuspend函数,而非pause函数。

函数原型:

  1. int sigsuspend(const sigset_t *mask); 

函数作用:挂起等待信号;

函数参数:mask,传入参数,sigsuspend函数调用期间,进程信号屏蔽字由参数mask指定。

具体用法:可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,也就是在调用sigsuspend函数时对该信号解除屏蔽,然后挂起等待信号。但我们此时已经改变了进程的信号屏蔽字,所以调用完sigsuspend函数之后,应将进程的信号屏蔽字恢复原样。

  1.  #include <unistd.h> 
  2.  #include <signal.h> 
  3.  #include <stdio.h> 
  4.   
  5.  void sig_alrm(int signo) 
  6.  { 
  7.      /* nothing to do */ 
  8.  } 
  9.   
  10. unsigned int mysleep(unsigned int nsecs) 
  11.     struct sigaction newact, oldact; 
  12.     sigset_t newmask, oldmask, suspmask; 
  13.     unsigned int unslept; 
  14.  
  15.     //1.为SIGALRM设置捕捉函数,一个空函数 
  16.     newact.sa_handler = sig_alrm
  17.     sigemptyset(&newact.sa_mask); 
  18.     newact.sa_flags = 0
  19.     sigaction(SIGALRM, &newact, &oldact); 
  20.  
  21.     //2.设置阻塞信号集,阻塞SIGALRM信号 
  22.     sigemptyset(&newmask); 
  23.     sigaddset(&newmask, SIGALRM); 
  24.    sigprocmask(SIG_BLOCK, &newmask, &oldmask);   //信号屏蔽字 mask 
  25.  
  26.     //3.定时n秒,到时后可以产生SIGALRM信号 
  27.     alarm(nsecs); 
  28.  
  29.     /*4.构造一个调用sigsuspend临时有效的阻塞信号集, 
  30.      *  在临时阻塞信号集里解除SIGALRM的阻塞*/ 
  31.     suspmask = oldmask
  32.     sigdelset(&suspmask, SIGALRM); 
  33.  
  34.     /*5.sigsuspend调用期间,采用临时阻塞信号集suspmask替换原有阻塞信号集 
  35.      *  这个信号集中不包含SIGALRM信号,同时挂起等待, 
  36.      *  当sigsuspend被信号唤醒返回时,恢复原有的阻塞信号集*/ 
  37.     sigsuspend(&suspmask);  
  38.  
  39.     unslept = alarm(0); 
  40.     //6.恢复SIGALRM原有的处理动作,呼应前面注释1 
  41.     sigaction(SIGALRM, &oldact, NULL); 
  42.  
  43.     //7.解除对SIGALRM的阻塞,呼应前面注释2 
  44.     sigprocmask(SIG_SETMASK, &oldmask, NULL); 
  45.  
  46.     return(unslept); 
  47.  
  48. int main(void) 
  49.     while(1){ 
  50.         mysleep(2); 
  51.         printf("Two seconds passed\n"); 
  52.     } 
  53.  
  54.     return 0; 

##可重入函数/不可重入函数

一个函数在被调用执行期间尚未调用结束的时候,由于某种时序,该函数又被重复调用,这种情况称为「重入」。如果从信号处理程序返回,则继续执行进程断点处的正常指令序列,从重新恢复到断点重新执行的过程中,函数所依赖的环境没有发生改变,就说这个函数是可重入的,反之就是不可重入的。

如果要将函数做成可重入函数,则函数内不能含有全局变量及static变量,也不能使用malloc、free。

本文授权转载自公众号「良许Linux」。良许,世界500强外企Linux开发工程师,公众号里分享大量Linux干货,欢迎关注!

 

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2020-10-18 07:13:44

Linux系统编程信号捕捉

2020-10-10 07:18:14

Linux系统编程管道

2020-09-26 21:43:59

Linux系统编程条件变量

2020-10-05 22:01:02

Linux系统编程线程属性

2020-09-22 07:35:06

Linux线程进程

2020-09-28 06:49:50

Linux系统编程互斥量mutex

2020-09-26 23:09:00

Linux系统编程读写锁

2020-09-25 07:34:40

Linux系统编程信号量

2020-10-08 10:10:51

Linux系统编程信号集

2020-10-09 07:13:11

Linux系统编程mmap

2017-02-28 18:26:09

Linuxinput子系统编程

2023-12-29 09:28:25

Java编程

2023-03-14 08:01:53

Go开发原子操作

2023-06-27 13:46:00

前端竞态promise

2010-03-05 13:34:54

2022-11-11 15:49:09

前端JavaScript开发

2019-03-15 09:30:09

Linux系统CPU

2022-11-11 10:22:54

前端Promise

2009-07-03 11:57:18

系统编程安全linux

2010-02-02 13:26:53

Linux内核
点赞
收藏

51CTO技术栈公众号