Reactor网络模型核心思想探秘

网络 网络管理
reactor网络模型是网络编程中非常重要的一种编程思想,本文通过一个简短的示例试图讲明白reactor网络编程模型的核心思想。当然,本文的实现还不是很完善,比如在调用回调函数的时候还是传入了fd,我们是否可以不需要这个参数,彻彻底底地和IO进行分离呢?

在网络编程系列文章中,我们实现了一个基于epoll的网络框架,并在此基础上开发了一个简单的HTTP服务,在那个系列文章中我们使用了读、写两个buffer将网络IO和数据的读写进行了分离,它们之间的扭转完全通过epoll事件通知,如果你认真研究过源码,会发现,所有针对网络IO的操作都是由事件触发的。这种基于事件触发的网络模型通常我们叫做Reactor网络模型。

由于网络编程系列文章中代码实现相对比较复杂,不太好讲清楚。所以,我决定单独出几篇文章对那个系列文章进行一些拓展,主要涉及到网络编程思想和性能测试。

这篇文章我们通过实现一个简单的网络框架,来说明Reactor网络模型实现的一般思路,其本质思想和x-net项目基本上是一样的,只是在代码上做了非常大的精简,理解起来会轻松很多。

首先,我们来看一段代码

#include <sys/socket.h>
#include <errno.h>
#include <netinet/in.h>
#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/epoll.h>




int main() {
    int sockfd = socket(AF_INET, SOCK_STREAM, 0);


    struct sockaddr_in servaddr;
    memset(&servaddr, 0, sizeof(struct sockaddr_in));


    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
    servaddr.sin_port = htons(2048);


    if (-1 == bind(sockfd, (struct sockaddr*)&servaddr, sizeof(struct sockaddr))) {
        perror("bind fail");
        return -1;
    }


    listen(sockfd, 10);


    printf("sock-fd:%d\n", sockfd);


    int epfd = epoll_create(1);


    struct epoll_event ev;
    ev.events = EPOLLIN;
    ev.data.fd = sockfd;


    epoll_ctl(epfd, EPOLL_CTL_ADD, sockfd, &ev);


    struct epoll_event events[1024] = {0};


    while(1) {
        int nready = epoll_wait(epfd, events, 1024, -1);


        int i = 0;
        for (i = 0; i < nready; i++) {
            int connfd = events[i].data.fd;
            if (events[i].events & EPOLLIN && sockfd == connfd) {
                struct sockaddr_in clientaddr;
                socklen_t len = sizeof(clientaddr);


                int clientfd = accept(sockfd, (struct sockaddr*)&clientaddr, &len);


                ev.events = EPOLLIN | EPOLLET;
                ev.data.fd = clientfd;
                epoll_ctl(epfd, EPOLL_CTL_ADD, clientfd, &ev);


                printf("clientfd: %d\n", clientfd);
            } else if (events[i].events & EPOLLIN) {


                char buffer[10] = {0};


                int count = recv(connfd, buffer, 10, 0);
                if (count == 0) {
                    printf("discounnect\n");


                    epoll_ctl(epfd, EPOLL_CTL_DEL, connfd, NULL);
                    close(i);


                    continue;
                }


                send(connfd, buffer, count, 0);
                printf("clientfd: %d, count: %d, buffer: %s\n", connfd, count, buffer);
            }
        }
    }
}

熟悉epoll的人应该对上面的代码比较熟悉,这段代码的核心在下面的while主循环,如果是当前Server的Socket说明有新的连接进来,调用accept拿到客户端的fd,将其放在epoll的events中,并注册EPOLLIN事件,一般我们理解为可读事件。

如果不是sockfd,说明是客户端的fd可读,我们将数据读出来再原样发送回去。

上面的代码存在的主要问题在于,套接字的accept和读写操作我们是直接写在主循环里了,这将会让代码的逻辑变得难以琢磨。

对于一个套接字,最直接的操作就是读和写。所以,最容易想到的就是将读和写分离开。为了实现读和写分离我们封装两个回调函数,如下:

int recv_callback(int fd, char *buffer, int size);
int send_callback(int fd, char *buffer, int size);

你可以想一下,这两个函数应该怎么写?下面是根据原有的逻辑将读和写封装在了recv_callback和send_callback两个函数中,代码如下:

int recv_callback(int fd, char *buffer, int size) {
    int count = recv(fd, buffer, size, 0);


    send_callback(fd, buffer, count, 0);


    return count;
}
int send_callback(int fd, char *buffer, int size) {
    int count = send(fd, buffer, size, 0);


    return count;
}

然后,在主循环中就可以这样使用

int main() {


    ...


    while(1) {
        int nready = epoll_wait(epfd, events, 1024, -1);


        int i = 0;
        for (i = 0; i < nready; i++) {
            int connfd = events[i].data.fd;


            if (events[i].events & EPOLLIN && sockfd == connfd) {
                ...
            } else if (events[i].events & EPOLLIN) {
                char buffer[10] = {0};


                int count = recv_callback(fd, buffer, 10);
                if (count == 0) {
                    printf("disconnect\\n");
                    epoll_ctl(epfd, EPOLL_CTL_DEL, connfd, NULL);
                    clise(i);
                    continue;
                }
            }
        }
    } 
}

虽然我们将读和写拆成了两个方法,但读和写并没有分离开,我们在recv_callback中每次收到数据之后调用send_callback将数据原样又发回去,在这里我们希望recv_callback和send_callback各管各的互不干扰,比如像下面这样

int recv_callback(int fd, char *buffer, int size) {
    int count = recv(fd, buffer, size, 0);


    return count;
}
int send_callback(int fd, char *buffer, int size) {
    int count = send(fd, buffer, size, 0);


    return count;
}

但这样明显也是有问题的,在recv_callback中读完了之后,如何发送数据呢?这里,我们可以想一下,围绕着一个套接字都有哪些部分呢?是不是可以设计出一个类似字典的结构,这个字典的key对应的就是套接字,而value对应的就是围绕套接字相关的各个组件。

我们将recv_callback和send_callback放在了一个conn_channel结构体中,并且设计了两个buffer,一个用来读数据,另一个用来发数据,conn_channel便是这个字典对应的value,代码如下:

#define BUF_LEN   1024


typedef int(*callback)(int fd);


struct conn_channel {
    int fd;


    callback recv_call;
    callback send_call;


    char wbuf[BUF_LEN];
    int wlen;
    char rbuf[BUF_LEN];
    int rlen;
};

其中,fd表示的是当前客户端套接字。然后我们定义一个数组来表示套接字到套接字value的映射关系,代码如下:

struct conn_channel conn_map[1024] = {0};

这样,我们在主循环中,就可以像下面这样,往conn_map中添加对应的套接字了,代码如下:

int main() {
    ...


    while(1) {
        int nready = epoll_wait(epfd, events, 1024, -1);


        int i = 0;
        for (i = 0; i < nready; i++) {
            int connfd = events[i].data.fd;


            if (events[i].events & EPOLLIN && sockfd == connfd) {
                struct sockaddr_in clientaddr;
                socklen_t len = sizeof(clientaddr);


                int clientfd = accept(sockfd, (struct sockaddr*)&clientaddr, &len);


                ev.events = EPOLLIN;
                ev.data.fd = clientaddr;


                epoll_ctl(epfd, EPOLL_CTL_ADD, clientfd, &ev);


                conn_map[clientfd].fd = clientfd;
                conn_map[clientfd].rlen = 0;
                conn_map[clientfd].wlen = 0;
                conn_map[clientfd].recv_call = recv_callback;
                conn_map[clientfd].send_call = send_callback;
                memset(conn_map[clientfd].rbuf, 0, BUF_LEN);
                memset(conn_map[clientfd].wbuf, 0, BUF_LEN);


                printf("clientfd:%d\\n", clientfd);
            } else if (events[i].events & EPOLLIN) {
                ...
            }
        }
    } 
}

在上面的代码中,每当accept出来一个客户端的套接字,我们就将它放到conn_map中,设置好读写buffer和回调函数。但如果你细心点会发现,recv_callback、send_callback和conn_channel中的回调函数签名是不一样的。所以,我们要调整一下这两个函数的实现,调整之后代码如下:

int recv_callback(int fd) {
    int count = recv(fd, conn_map[fd].rbuf + conn_map[fd].rlen, BUF_LEN - conn_map[fd].rlen, 0);
    // do something


    memcpy(conn_map[fd].wbuf, conn_map[fd].rbuf, conn_map[fd].rlen);
    conn_map[fd].wlen = conn_map[fd].rlen;
    conn_map[fd].rlen = 0;


    return count;
}
int send_callback(int fd) {
    int count = send(fd, conn_map[fd].wbuffer, conn_map[fd].wlen, 0);


    return count;
}

因为有了conn_map,所以原来传进来的buffer和size都不需要了,在conn_channel中已经有记录了。所以只需要一个fd参数就可以了。我们在recv_callback中模拟了回复消息,强行将读到的数据写到了wbuffer中。这里补充一下,conn_channel中的rbuffer是用来从套接字中读数据的,wbuffer表示的是将要发送到套接字的数据。

你可以试着把上面的代码跑起来,然后你会发现,并没有按我们的预期执行,send_callback中的send似乎没有起作用。这是因为我们只是将数据从rbuffer写到了wbuffer中,而send_callback并没有机会调用。你可以想一想send_callback放在哪里调用比较合适呢?

在上面的例子中,显然放在主循环中执行比较合适,在epoll中,EPOLLOUT表示可写事件,我们可以利用这个事件。在recv_callback执行完之后我们注册一个EPOLLOUT事件,然后在主循环中我们去监听EPOLLOUT事件。这样,当recv_callback将rbuffer的数据复制到wbuffer中之后,send_callback通过EPOLLOUT事件就可以在主循环中得以执行。

为了实现上面的效果我们要修改两个地方,一个是recv_callback中我们要注册一下EPOLLOUT事件,代码如下:

int recv_callback(int fd) {
    int count = recv(fd, conn_map[fd].rbuf + conn_map[fd].rlen, BUF_LEN - conn_map[fd].rlen, 0);
    // do something


    memcpy(conn_map[fd].wbuf, conn_map[fd].rbuf, conn_map[fd].rlen);
    conn_map[fd].wlen = conn_map[fd].rlen;
    conn_map[fd].rlen = 0;


    struct epoll_event ev;
    ev.events = EPOLLOUT;
    ev.data.fd = fd;


    epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &ev);


    return count;
}

我们在rbuf拷贝到wbuf之后,给当前fd注册了EPOLLOUT事件,然后我们在主循环中要处理EPOLLOUT事件,代码如下:

int main() {
    ...


    while(1) {
        int nready = epoll_wait(epfd, events, 1024, -1);


        int i = 0;
        for (i = 0; i < nready; i++) {
            int connfd = events[i].data.fd;


            if (events[i].events & EPOLLIN && sockfd == connfd) {
                struct sockaddr_in clientaddr;
                socklen_t len = sizeof(clientaddr);


                int clientfd = accept(sockfd, (struct sockaddr*)&clientaddr, &len);


                ev.events = EPOLLIN;
                ev.data.fd = clientaddr;


                epoll_ctl(epfd, EPOLL_CTL_ADD, clientfd, &ev);


                conn_map[clientfd].fd = clientfd;
                conn_map[clientfd].rlen = 0;
                conn_map[clientfd].wlen = 0;
                conn_map[clientfd].recv_call = recv_callback;
                conn_map[clientfd].send_call = send_callback;
                memset(conn_map[clientfd].rbuf, 0, BUF_LEN);
                memset(conn_map[clientfd].wbuf, 0, BUF_LEN);


                printf("clientfd:%d\\n", clientfd);
            } else if (events[i].events & EPOLLIN) {
                int count = conn_map[connfd].recv_call(connfd);
                printf("recv-count:%d\\n", count);
            } else if (events[i].events & EPOLLOUT) { // 处理EPOLLOUT事件
                int count  = conn_map[connfd].send_call(connfd);
                printf("send-count:%d\\n", count);
            }
        }
    } 
}

要注意的是,epfd是在main函数中定义的,而我们在recv_callback中有使用,所以我们可以暂时将epfd声明成一个全局变量,放在外面。

上面的代码有一个问题,EPOLLOUT事件触发之后你会发现再向当前fd发送数据,就没响应了,这是因为epoll事件被我们修改了,为了解决这个问题我们可以在send_callback执行完之后再设置回去,如下:

int send_callback(int fd) {
    int count = send(fd, conn_map[fd].wbuffer, conn_map[fd].wlen, 0);


    struct epoll_event ev;
    ev.events = EPOLLIN;
    ev.data.fd = fd;


    epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &ev);


    return count;
}

这样,我们就将IO操作给屏蔽了,在主循环中我们只关注事件,不同的事件调用不同的回调函数。在对应的回调函数中只做自己该做的,做完之后注册事件通知其它的回调函数。

但是,上面的代码还不够优雅,对于accept和读事件来讲在epoll中都是EPOLLIN事件,这两个是不是可以合并在一起处理呢?答案是可以的,首先,我们要将accept相关的逻辑给拆出来,拆解之后的代码如下:

int accept_callback(int fd) {
    struct sockaddr_in clientaddr;
    socklen_t len = sizeof(clientaddr);


    int clientfd = accept(fd, (struct sockaddr*)&clientaddr, &len);


    ev.events = EPOLLIN;
    ev.data.fd = clientaddr;


    epoll_ctl(epfd, EPOLL_CTL_ADD, clientfd, &ev);


    conn_map[clientfd].fd = clientfd;
    conn_map[clientfd].rlen = 0;
    conn_map[clientfd].wlen = 0;
    conn_map[clientfd].recv_call = recv_callback;
    conn_map[clientfd].send_call = send_callback;
    memset(conn_map[clientfd].rbuf, 0, BUF_LEN);
    memset(conn_map[clientfd].wbuf, 0, BUF_LEN);


    return clientfd;
}

我们发现,accept_callback和recv_callback以及send_callback的签名是一样的,这样我们可以在conn_channel用一个union,将accept_callback也放到conn_channel中来。如下:

struct conn_channel {
    int fd;


    union {
        callback accept_call;
        callback recv_call;
    } call_t;
    callback send_call;


    char wbuf[BUF_LEN];
    int wlen;
    char rbuf[BUF_LEN];
    int rlen;
};

在主循环中,我们就可以先给sockfd注册好accept回调函数,然后我们只需要在主循环中保留两个逻辑就可以了,代码如下:

int main() {
    int sockfd = create_serv(9000);
    if (sockfd == -1) {
        perror("create-server-fail");
        return -1;
    }


    make_nonblocking(sockfd);


    epfd = epoll_create1(1);


    struct epoll_event ev;
    ev.events = EPOLLIN;
    ev.data.fd = sockfd;


    epoll_ctl(epfd, EPOLL_CTL_ADD, sockfd, &ev);


    struct epoll_event events[1024] = {0}; 


    conn_map[sockfd].rlen = 0;
    conn_map[sockfd].wlen = 0;
    conn_map[sockfd].fd = sockfd;
    conn_map[sockfd].call_t.accept_call = accept_callback;
    conn_map[sodkfd].send_call = send_callback;
    memset(conn_map[sockfd].rbuf, 0, BUF_LEN);
    memset(conn_map[sockfd].wbuf, 0, BUF_LEN);


    while(1) {
        int nready = epoll_wait(epfd, events, 1024, -1);


        int i = 0;
        for (i = 0; i < nready; i++) {
            int connfd = events[i].data.fd;
            if (events[i].events & EPOLLIN) {
                int count = conn_map[connfd].call_t.recv_call(connfd);
                printf("recv-count:%d\\n", count);
            } else if (events[i].events & EPOLLOUT) {
                int count  = conn_map[connfd].send_call(connfd);
                printf("send-count:%d\\n", count);
            }
        }
    } 
}

你可以想一下,我们注册的是call_t.accept_call,但在调用的时候确是call_t.recv_call,为什么这样可行?

我们在网络编程系列文章中,单独为accept抽象出了一个对象,你可以对比一下这两种实现方式,看看它们有什么区别?在系列文件中我们为什么要单独抽象出一个accepter对象呢?

可以看到,最后主循环中的逻辑,只有两个分支,这两个分支代表了两种事件,这种通过事件驱动的网络模型便是Reactor网络模型。本文为了容易理解,将代码进行了精简。在实际的工程中我们还要考虑诸多情况。比如,上面的代码只支持epoll,我们是不是可以将事件驱动相关的代码抽象成单独的组件,让其可以支持其它的事件模型。

本文虽然代码简单,但Reactor网络模型的实现基本上都逃脱不了这个套路,只是在此基础上可能会将各个部分进行单独的封装,比如我们在网络编程系列文章中就将channel和map进行了抽象,让它能适配各种场景。

总结

reactor网络模型是网络编程中非常重要的一种编程思想,本文通过一个简短的示例试图讲明白reactor网络编程模型的核心思想。当然,本文的实现还不是很完善,比如在调用回调函数的时候还是传入了fd,我们是否可以不需要这个参数,彻彻底底地和IO进行分离呢?

责任编辑:武晓燕 来源: 程序员班吉
相关推荐

2022-05-12 09:00:50

动态规划算法项目

2022-05-09 09:03:04

SQL数据流数据

2015-08-26 09:18:16

云原生云原生机制云原生框架

2024-05-31 08:10:58

Netty线程模型多路复用模型

2020-12-01 07:08:23

Linux网络I

2023-12-06 09:33:54

Reactor网络

2010-08-18 10:13:55

IntentAndroid

2022-01-04 11:11:32

Redis单线程Reactor

2024-04-18 09:34:28

Reactor项目异步编程

2010-01-27 17:38:58

Windows Emb

2010-03-12 17:09:18

2023-02-01 18:31:03

陈峰 数仓宝贝库

2018-07-20 14:30:15

2022-09-29 15:39:10

服务器NettyReactor

2010-08-27 10:41:41

iPhone核心应用程序

2023-11-30 11:39:52

Rust生态框架

2024-02-27 22:31:00

Feign动态代理核心

2024-08-16 21:30:00

IO网络网络通信

2021-06-16 14:18:37

NettyReactor线程模型

2010-09-26 14:08:41

Java垃圾回收
点赞
收藏

51CTO技术栈公众号