谈谈你对IO多路复用机制的理解

系统 Linux
IO多路复用是一种同步的IO模型。利用IO多路复用模型,可以实现一个线程监视多个文件句柄;一旦某个文件句柄就绪,就能够通知到对应应用程序进行相应的读写操作;没有文件句柄就绪时就会阻塞应用程序,从而释放出CPU资源。

​ 一位工作5年的小伙伴面试时被问到IO相关的问题,说,谈谈你对IO多路复用机制的理解。当时他说只是听过多路复用,具体细节没有了解过。今天,我给大家分享一下我的理解。

1.IO多路复用

图片

IO多路复用是一种同步的IO模型。利用IO多路复用模型,可以实现一个线程监视多个文件句柄;一旦某个文件句柄就绪,就能够通知到对应应用程序进行相应的读写操作;没有文件句柄就绪时就会阻塞应用程序,从而释放出CPU资源。

图片

IO可以理解为,在操作系统中,数据在内核态和用户态之间的读、写操作,大部分情况下是指网络IO;

图片

多路大部分情况下是指多个TCP连接,也就是多个Socket 或者多个Channel;

图片

复用是指复用一个或多个线程资源。IO多路复用意思就是说,一个或多个线程处理多个 TCP 连接。尽可能地减少系统开销,无需创建和维护过多的进程/线程。

图片

实现IO多路复用的模型有三种,分别是Select、poll 和 epoll。下面详细介绍一下三种多路复用模型的基本原理和优缺点:

2.select模型

图片

select模型,它的基本原理是,采用轮询和遍历的方式。也就是说,在客户端操作服务器时,会创建三种文件描述符,简称FD。分别是writefds(写描述符)、readfds(读描述符)和 exceptfds(异常描述符)。

图片

而select会阻塞监视这三种文件描述符,等有数据、可读、可写、出异常或超时都会返回;

图片

返回后通过遍历fdset,也就是文件描述符的集合,来找到就绪的FD,然后,触发相应的IO操作。

图片

它的优点是跨平台支持性好,几乎在所有的平台上支持。

图片

它的缺点也很明显,由于select是采用轮询的方式进行全盘扫描,因此,随着FD数量增多而导致性能下降。

图片

因此,每次调用select()方法,都需要把FD集合从用户态拷贝到内核态,并进行遍历。而操作系统对单个进程打开的FD数量是有限制的,一般默认是1024个。虽然,可以通过操作系统的宏定义FD_SETSIZE修改最大FD数量限制,但是,在IO吞吐量巨大的情况下,效率提升仍然有限。

3.poll模型

图片

poll 模型的原理与select模型基本一致,也是采用轮询加遍历,唯一的区别就是 poll 采用链表的方式来存储FD。

所以,它的优点点是没有最大FD的数量限制。

图片

它的缺点和select一样,也是采用轮询方式全盘扫描,同样也会随着FD数量增多而导致性能下降。

图片

4.epoll模型

由于select和poll都会因为吞吐量增加而导致性能下降,因此,才出现了epoll模型。

epoll模型是采用时间通知机制来触发相关的IO操作。它没有FD个数限制,而且从用户态拷贝到内核态只需要一次。它主要通过系统底层的函数来注册、激活FD,从而触发相关的 IO 操作,这样大大提高了性能。主要是通过调用以下三个系统函数:

图片

(1)epoll_create()函数,在系统启动时,会在Linux内核里面申请一个B+树结构的文件系统,然后,返回epoll对象,也是一个FD。

图片

(2)epoll_ctl()函数,每新建一个连接的时候,会同步更新epoll对象中的FD,并且绑定一个 callback回调函数。

图片

(3)epoll_wait()函数,轮询所有的callback集合,并触发对应的 IO 操作

图片

所以,epoll模型最大的优点是将轮询改成了回调,大大提高了CPU执行效率,也不会随FD数量的增加而导致效率下降。当然,它也没有FD数量限制,也就是说,它能支持的FD上限是操作系统的最大文件句柄数。一般而言,1G 内存大概支持 10 万个句柄。分布式系统中常用的组件如Redis、Nginx都是优先采用epoll模型。

图片

它的缺点是只能在Linux下工作。

5.综合对比

下表是三种多路复用模型的综合对比,有兴趣的小伙伴可以截图保存一下,或者到我的个人煮叶简介中获取。

图片

好了,以上就是我对IO多路复用机制的理解。

责任编辑:武晓燕 来源: Tom弹架构
相关推荐

2024-09-26 16:01:52

2020-10-14 09:11:44

IO 多路复用实现机

2023-11-07 08:19:35

IO多路复用磁盘、

2023-01-09 10:04:47

IO多路复用模型

2021-05-31 06:50:47

SelectPoll系统

2024-08-08 14:57:32

2023-05-08 00:06:45

Go语言机制

2023-12-13 09:45:49

模型程序

2023-03-01 14:32:31

redisIOEpoll

2011-12-08 10:51:25

JavaNIO

2022-06-30 09:10:33

NoSQLHBaseRedis

2023-11-28 12:25:02

多线程安全

2020-10-13 07:51:03

五种IO模型

2023-12-06 07:16:31

Go语言语句

2022-04-13 07:59:23

IOBIONIO

2024-08-26 14:52:58

JavaScript循环机制

2022-07-11 08:02:15

KafkaSelector

2009-06-29 18:09:12

多路复用Oracle

2022-01-06 14:45:10

数据库连接池IO

2022-09-12 06:33:15

Select多路复用
点赞
收藏

51CTO技术栈公众号