阻塞和非阻塞的实现

存储 存储软件
我们可能都已经听过阻塞非阻塞的概念,本文以tcp中的connect系统调用为例子(基于1.12.13内核,新版的原理类似,但是过程就很复杂了,有时间再分析),分析阻塞和非阻塞是什么并且看他是如何实现的。话不多说,直接开始。

[[403799]]

本文转载自微信公众号「编程杂技」,作者theanarkh。转载本文请联系编程杂技公众号。

我们可能都已经听过阻塞非阻塞的概念,本文以tcp中的connect系统调用为例子(基于1.12.13内核,新版的原理类似,但是过程就很复杂了,有时间再分析),分析阻塞和非阻塞是什么并且看他是如何实现的。话不多说,直接开始。

  1. static int inet_connect(struct socket *sock, struct sockaddr * uaddr, 
  2.       int addr_len, int flags) 
  3.   struct sock *sk=(struct sock *)sock->data; 
  4.   // 调用底层的连接函数,发一个syn包 
  5.   err = sk->prot->connect(sk, (struct sockaddr_in *)uaddr, addr_len); 
  6.   if (err < 0)  
  7.     return(err); 
  8.  
  9.   // 还没建立连接成功并且是非阻塞的方式,直接返回 
  10.   if (sk->state != TCP_ESTABLISHED &&(flags & O_NONBLOCK))  
  11.       return(-EINPROGRESS); 
  12.   // 早期通过关中断防止竞态情况 
  13.   cli();  
  14.   // 连接建立中,阻塞当前进程 
  15.   while(sk->state == TCP_SYN_SENT || sk->state == TCP_SYN_RECV)  
  16.   { 
  17.     // 阻塞进程 
  18.     interruptible_sleep_on(sk->sleep); 
  19.     // 连接失败 
  20.     if(sk->err && sk->protocol == IPPROTO_TCP) 
  21.     { 
  22.       sti(); 
  23.       sock->state = SS_UNCONNECTED; 
  24.       err = -sk->err; 
  25.       sk->err=0; 
  26.       return err; /* set by tcp_err() */ 
  27.     } 
  28.   } 
  29.   sti(); 
  30.   // 连接建立 
  31.   sock->state = SS_CONNECTED; 
  32.   // 返回成功 
  33.   return(0); 

我们看到connect函数首先会调用tcp层的函数发送一个sync包,然后根据socket的属性(阻塞非阻塞,可以通过setsocketopt设置)做下一步处理,如果是非阻塞,那么就比较简单,直接返回给应用层。这也是非阻塞+事件驱动架构中的做法。因为这种架构下通常是单进程的,要避免阻塞进程,那么返回后什么时候才能知道连接成功呢?这就是epoll提供的机制,当连接成功后,tcp层会通知epoll,epoll就会通知应用层。下面我们继续分析阻塞的过程,interruptible_sleep_on(sk->sleep)。我们看到socket中有一个sleep字段,该字段用于管理队列。我们看看interruptible_sleep_on

  1. void interruptible_sleep_on(struct wait_queue **p) 
  2.   __sleep_on(p,TASK_INTERRUPTIBLE); 
  3.  
  4. static inline void __sleep_on(struct wait_queue **p, int state) 
  5.   unsigned long flags; 
  6.   struct wait_queue wait = { currentNULL }; 
  7.   current->state = state; 
  8.   add_wait_queue(p, &wait); 
  9.   save_flags(flags); 
  10.   sti(); 
  11.   schedule(); 
  12.   remove_wait_queue(p, &wait); 
  13.   restore_flags(flags); 

这里我们只关注两个地方add_wait_queue和schedule。add_wait_queue就是把一个节点插入队列。我们看看wait_queue的定义。

  1. struct wait_queue { 
  2.     struct task_struct * task; 
  3.     struct wait_queue * next
  4. }; 

所以add_wait_queue执行完之后架构如下。

接着调用schedule调度其他进程执行,我们发现这时候当前进程的状态是TASK_INTERRUPTIBLE,所以是不会被调度执行的。这就是进程阻塞的原理,主要是两个过程

1 加入等待队列

2 让出CPU,调度其他进程执行。

我们这个进程什么时候被唤醒呢?我们从收到sync的回包开始分析。具体逻辑在tcp_rcv中。

  1. if(sk->state==TCP_SYN_SENT) 
  2.     { 
  3.       /* Crossed SYN or previous junk segment */ 
  4.       // 发送了syn包,收到ack包说明可能是建立连接的ack包 
  5.       if(th->ack) 
  6.      { 
  7.         // 发送第三次握手的ack包,进入连接建立状态 
  8.         tcp_send_ack(sk->sent_seq,sk->acked_seq,sk,th,sk->daddr); 
  9.         tcp_set_state(sk, TCP_ESTABLISHED); 
  10.         // 唤醒阻塞在connect函数的进程 
  11.         if(!sk->dead) 
  12.         { 
  13.           // 唤醒进程 
  14.           sk->state_change(sk); 
  15.           // 给进程发送SIGIO信号 
  16.           sock_wake_async(sk->socket, 0); 
  17.         } 
  18.       } 
  19.     } 

我们看到收到ack后,tcp层调用state_change回调,state_change的值是def_callback1。

  1. static void def_callback1(struct sock *sk) 
  2.   if(!sk->dead) 
  3.     wake_up_interruptible(sk->sleep); 

我们看到这里会调用wake_up_interruptible唤醒进程。我们看看实现。

  1. void wake_up_interruptible(struct wait_queue **q) 
  2.   struct wait_queue *tmp; 
  3.   struct task_struct * p; 
  4.  
  5.   if (!q || !(tmp = *q)) 
  6.     return
  7.   do { 
  8.     if ((p = tmp->task) != NULL) { 
  9.       if (p->state == TASK_INTERRUPTIBLE) { 
  10.         p->state = TASK_RUNNING; 
  11.         if (p->counter > current->counter + 3) 
  12.           need_resched = 1; 
  13.       } 
  14.     } 
  15.     tmp = tmp->next
  16.   } while (tmp != *q); 

 

我们看到wake_up_interruptible会唤醒所有进程,这就是导致景群效应的地方,新版内核已经处理了相关问题。另外我们看到,这里这是修改进程为可执行状态,但是不会立刻调度,要等下一次进程调度的时候才发生进程调度。以上就是进程阻塞和非阻塞的原理。

 

责任编辑:武晓燕 来源: 编程杂技
相关推荐

2012-10-10 10:00:27

同步异步开发Java

2015-07-03 10:12:04

编程同步非阻塞

2022-06-22 08:16:29

异步非阻塞框架

2019-07-23 11:01:57

Python同步异步

2017-03-01 16:40:12

Linux驱动技术设备阻塞

2012-02-22 21:15:41

unixIO阻塞

2023-03-15 08:39:07

远程服务调用

2023-07-31 08:55:01

Java NIO非阻塞阻塞

2018-03-28 08:52:53

阻塞非阻塞I

2023-12-13 09:45:49

模型程序

2023-12-06 07:28:47

阻塞IO异步IO

2024-09-23 17:15:28

Python并发并行

2013-08-09 09:27:31

2021-02-27 16:08:17

Java异步非阻塞

2011-12-07 17:17:02

JavaNIO

2011-12-08 10:12:34

JavaNIO

2020-05-08 10:34:30

Spring非阻塞编程

2021-02-04 10:50:11

网络安全非阻塞模Winsock编程

2024-06-19 10:26:36

非阻塞IO客户端

2018-01-11 08:24:45

服务器模型详解
点赞
收藏

51CTO技术栈公众号