Redis高性能架构详解(图文全面总结)-51CTO.COM

IO多路复用技术

Redis的高性能，有功于其使用的 IO 多路复用技术（IO multiplexing）。

IO 多路复用是一种 IO 模型，它使单个线程可以监视多个文件描述符（如：网络套接字）。

这种机制避免了为每个连接创建一个线程或进程的开销，从而提升了性能。

Redis 在处理网络 IO 时，采用异步非阻塞模式，利用了操作系统提供的 IO 多路复用技术（如 epoll），可以同时处理多个客户端连接而不会阻塞整个服务进程。

如下图所示:

图片

IO 多路复用库，包括：select、poll、epoll（Linux）。

在不同的操作系统上，Redis 会选择最适合的 IO 多路复用库，Linux：主要使用 epoll。

epoll 是 Linux 下的高性能 IO 多路复用机制，利用了红黑树和事件就绪队列，提供了更高效的文件描述符管理和事件通知，适合于需要处理大量并发连接的场景。

Redis之所以性能快，主要原因是它将数据存储在"内存"中，而不是在磁盘上。

原因很简单，内存的读写带宽远高于磁盘，支持更高的并发读写操作。

为什么磁盘慢这么多呢？原因是自己的设计结构，如下图所示：

图片

一次数据的读写，主要会涉及到：寻道、以及旋转延迟。

为了读取、或写入数据，首先，磁头需要移动到正确的轨道上，这就是寻道。

如果每次读取，都需要定位到正确的轨道，这就需要时间，特别是机械硬盘，就非常浪费时间。

所以，磁头移动到目标轨道，这是最慢的一步之一。

当磁头到达目标轨道后，还需要等待盘片，旋转到正确位置以便访问数据块，这就会涉及到“旋转延迟”。

旋转延迟，通常占据了总I/O时间的一大部分，平均延迟时间约为盘片转一圈时间的一半。

所以，这些步骤，都是非常耗费性能的。

而内存，没有磁盘旋转、和磁头移动的机械延迟，访问时间在纳秒级别，而磁盘访问时间在毫秒级别。

所以，内存的速度会快非常多，这也是性能快的核心原因。

Redis提供了多种高效的数据结构（如：字符串、列表、集合、有序集合、哈希等），如下图所示：

图片

这些数据结构在内存中进行优化，能够快速进行数据操作。

比如：

LPUSH task_queue "task1"
RPOP task_queue

列表使用 QuickList（双向链表），可以在列表两端快速插入和删除元素。

常数时间复杂度：在列表两端进行的操作时间复杂度为 O(1)。

再比如：

SADD user_tags "tag1"
SISMEMBER user_tags "tag1"

集合基于哈希表实现，能够在常数时间内完成添加和检查操作。

Redis 使用自己优化的 RESP（REdis Serialization Protocol），网络通信协议。

该协议简单且高效，能够减少网络通信的开销，提升数据传输效率。

总之，Redis 通过上述多个方面的优化、和设计，使得它成为了一个高性能的分布式缓存，适用于各种需要快速响应、和处理大规模数据的应用场景。