IO多路复用技术
Redis的高性能,有功于其使用的 IO 多路复用技术(IO multiplexing)。
IO 多路复用是一种 IO 模型,它使单个线程可以监视多个文件描述符(如:网络套接字)。
这种机制避免了为每个连接创建一个线程或进程的开销,从而提升了性能。
Redis 在处理网络 IO 时,采用异步非阻塞模式,利用了操作系统提供的 IO 多路复用技术(如 epoll),可以同时处理多个客户端连接而不会阻塞整个服务进程。
如下图所示:
图片
IO 多路复用库,包括 :select、poll、epoll(Linux)。
在不同的操作系统上,Redis 会选择最适合的 IO 多路复用库,Linux:主要使用 epoll。
epoll 是 Linux 下的高性能 IO 多路复用机制,利用了红黑树和事件就绪队列,提供了更高效的文件描述符管理和事件通知,适合于需要处理大量并发连接的场景。
内存存储
Redis之所以性能快,主要原因是它将数据存储在"内存"中,而不是在磁盘上。
原因很简单,内存的读写带宽远高于磁盘,支持更高的并发读写操作。
为什么磁盘慢这么多呢?原因是自己的设计结构,如下图所示:
图片
一次数据的读写,主要会涉及到:寻道、以及旋转延迟。
寻道
为了读取、或写入数据,首先,磁头需要移动到正确的轨道上,这就是寻道。
如果每次读取,都需要定位到正确的轨道,这就需要时间,特别是机械硬盘,就非常浪费时间。
所以,磁头移动到目标轨道,这是最慢的一步之一。
旋转延迟
当磁头到达目标轨道后,还需要等待盘片,旋转到正确位置以便访问数据块,这就会涉及到“旋转延迟”。
旋转延迟,通常占据了总I/O时间的一大部分,平均延迟时间约为盘片转一圈时间的一半。
所以,这些步骤,都是非常耗费性能的。
而内存,没有磁盘旋转、和磁头移动的机械延迟,访问时间在纳秒级别,而磁盘访问时间在毫秒级别。
所以,内存的速度会快非常多,这也是性能快的核心原因。
数据结构高效
Redis提供了多种高效的数据结构(如:字符串、列表、集合、有序集合、哈希等),如下图所示:
图片
这些数据结构在内存中进行优化,能够快速进行数据操作。
比如:
LPUSH task_queue "task1"
RPOP task_queue
列表使用 QuickList(双向链表),可以在列表两端快速插入和删除元素。
常数时间复杂度:在列表两端进行的操作时间复杂度为 O(1)。
再比如:
SADD user_tags "tag1"
SISMEMBER user_tags "tag1"
集合基于哈希表实现,能够在常数时间内完成添加和检查操作。
优化的网络通信协议
Redis 使用自己优化的 RESP(REdis Serialization Protocol),网络通信协议。
该协议简单且高效,能够减少网络通信的开销,提升数据传输效率。
总之,Redis 通过上述多个方面的优化、和设计,使得它成为了一个高性能的分布式缓存,适用于各种需要快速响应、和处理大规模数据的应用场景。