Redis内存满了怎么办?让你玩懂8种内存淘汰策略

存储 存储软件 Redis
我们知道redis是一个非常常用的内存型数据库,数据从内存中读取是它非常高效的原因之一,那么但是如果有一天,「redis分配的内存满了怎么办」?

 [[387389]]

本文转载自微信公众号「moon聊技术」,作者moon聊技术。转载本文请联系moon聊技术公众号。

简介

我们知道redis是一个非常常用的内存型数据库,数据从内存中读取是它非常高效的原因之一,那么但是如果有一天,「redis分配的内存满了怎么办」?遇到这个面试题不要慌,这种问题我们分为两角度回答就可以:

  • 「redis会怎么做」?
  • 「我们可以怎么做」?

增加redis可用内存

这种方法很暴力,也很好用,我们直接通过增加redis的可用内存就可以了, 有两种方式

「通过配置文件配置」

  1. //设置redis最大占用内存大小为1000M   
  2. maxmemory 1000mb  

通过在redis安装目录下面的redis.conf配置文件中添加以下配置设置内存大小

「通过命令修改」

  1. //设置redis最大占用内存大小为1000M   
  2. 127.0.0.1:6379> config set maxmemory 1000mb   
  • redis支持运行时通过命令动态修改内存大小

这种方法是立竿见影的,reids 内存总归受限于机器的内存,也不能无限制的增长,那么如果没有办法再增加 redis 的可用内存怎么办呢?

内存淘汰策略

实际上Redis定义了「8种内存淘汰策略」用来处理redis内存满的情况:

1.noeviction:直接返回错误,不淘汰任何已经存在的redis键

2.allkeys-lru:所有的键使用lru算法进行淘汰

3.volatile-lru:有过期时间的使用lru算法进行淘汰

4.allkeys-random:随机删除redis键

5.volatile-random:随机删除有过期时间的redis键

6.volatile-ttl:删除快过期的redis键

7.volatile-lfu:根据lfu算法从有过期时间的键删除

8.allkeys-lfu:根据lfu算法从所有键删除

这些内存淘汰策略都很好理解,我们着重讲解一下lru,lfu,ttl是怎么去实现的

lru的最佳实践?

lru是Least Recently Used的缩写,也就是「最近很少使用」,也可以理解成最久没有使用。最近刚刚使用过的,后面接着会用到的概率也就越大。由于内存是非常金贵的,导致我们可以存储在缓存当中的数据是有限的。比如说我们固定只能存储1w条,当内存满了之后,缓存每插入一条新数据,都要抛弃一条最长没有使用的旧数据。我们把上面的内容整理一下,可以得到几点要求:

  • 「1.保证其的读写效率,比如读写的复杂度都是O(1)」
  • 「2.当一条数据被读取,将它最近使用的时间更新」
  • 「3.当插入一条新数据的时候,删除最久没有使用过的数据」

所以我们要尽可能的保证查询效率很高,插入效率很高,我们知道如果只考虑查询效率,那么hash表可能就是最优的选择,如果只考虑插入效率,那么链表必定有它的一席之地。

但是这两种数据结构单独使用,都有它的弊端,那么说,有没有一种数据结构,既能够保证查询效率,又能够保证插入效率呢?于是 hash+链表这种结构出现了

hash表用来查询在链表中的数据位置,链表负责数据的插入 当新数据插入到链表头部时有两种情况;

  • 1.当链表满的时候,将链表尾部的数据丢弃。
    • 这个比较简单,直接将链表尾部指针抹去,并且清除对应hash中的信息就好了
  • 2.每当缓存命中(即缓存数据被访问),则将数据移到链表头部;
    • 这种情况我们发现,如果命中到链表中间节点,我们需要做的是
    • 1).将该节点移到头节点
    • 2).「将该节点的上一个节点的下一个节点,设置为该节点的下一个节点」,这里就会有一个问题,我们无法找到该节点的上一个节点,因为是单向链表,所以,新的模型产生了。

这时双向链表的作用也提现出来了。能直接定位到父节点。这效率就很高了。而且由于双向链表有尾指针,所以剔除最后的尾节点也十分方便,快捷

所以最终的解决方案就是采用「哈希表+双向链表」的结构

lfu的最佳实践?

LFU:Least Frequently Used,最不经常使用策略,在一段时间内,数据被「使用频次最少」的,优先被淘汰。最少使用(LFU)是一种用于管理计算机内存的缓存算法。主要是记录和追踪内存块的使用次数,当缓存已满并且需要更多空间时,系统将以最低内存块使用频率清除内存.采用LFU算法的最简单方法是为每个加载到缓存的块分配一个计数器。每次引用该块时,计数器将增加一。当缓存达到容量并有一个新的内存块等待插入时,系统将搜索计数器最低的块并将其从缓存中删除。

这里我们提出一种达到 O(1) 时间复杂度的 LFU 实现方案,它支持的操作包括插入、访问以及删除

如图:

由两个双向链表+哈希表组成,上方的双向链表用来计数,下方的双向链表用来记录存储的数据,该链表的头节点存储了数字,哈希表的value对象记录下方双向链表的数据 我们这里按照插入的流程走一遍:

  • 将需要存储的数据插入
  • 在hash表中「存在」,找到对应的下方双向链表,将该节点的上一个节点和该节点的下一个节点相连(这里可能只有自己,直接移除就好),然后判断自己所在上方双向链表的计数是否比当前计数大1
    • 「如果是」,则将自己移到该上方双向链表,并且「判断该双向链表下是否还有元素」,如果没有,则要删除该节点
    • 「如果不是或者该上方双向列表无下个节点」则新加节点,将计数设为当前计数+1
  • 在hash表「不存在」,将数据存入hash表,将数据与双向链表的头节点相连(这里有可能链表未初始化)

这样当查找,插入时效率都为O(1)

redis TTL 是怎么实现的?

TTL存储的数据结构

redis针对TTL时间有专门的dict进行存储,就是redisDb当中的dict *expires字段,dict顾名思义就是一个hashtable,key为对应的rediskey,value为对应的TTL时间。?dict的数据结构中含有2个dictht对象,主要是为了解决hash冲突过程中重新hash数据使用。

TTL 设置过期时间

TTL设置key过期时间的方法主要是下面4个:

  • expire 按照相对时间且以秒为单位的过期策略
  • expireat 按照绝对时间且以秒为单位的过期策略
  • pexpire 按照相对时间且以毫秒为单位的过期策略
  • pexpireat 按照绝对时间且以毫秒为单位的过期策略
  1. {"expire",expireCommand,3,"w",0,NULL,1,1,1,0,0}, 
  2. {"expireat",expireatCommand,3,"w",0,NULL,1,1,1,0,0}, 
  3. {"pexpire",pexpireCommand,3,"w",0,NULL,1,1,1,0,0}, 
  4. {"pexpireat",pexpireatCommand,3,"w",0,NULL,1,1,1,0,0}, 

expire expireat pexpire pexpireat

从实际设置过期时间的实现函数来看,相对时间的策略会有一个当前时间作为基准时间,绝对时间的策略会「以0作为一个基准时间」。

  1. void expireCommand(redisClient *c) { 
  2.     expireGenericCommand(c,mstime(),UNIT_SECONDS); 
  3.  
  4. void expireatCommand(redisClient *c) { 
  5.     expireGenericCommand(c,0,UNIT_SECONDS); 
  6.  
  7. void pexpireCommand(redisClient *c) { 
  8.     expireGenericCommand(c,mstime(),UNIT_MILLISECONDS); 
  9.  
  10. void pexpireatCommand(redisClient *c) { 
  11.     expireGenericCommand(c,0,UNIT_MILLISECONDS); 

整个过期时间最后都会换算到绝对时间进行存储,通过公式基准时间+过期时间来进行计算。?对于相对时间而言基准时间就是当前时间,对于绝对时间而言相对时间就是0。?中途考虑设置的过期时间是否已经过期,如果已经过期那么在master就会删除该数据并同步删除动作到slave。?正常的设置过期时间是通过setExpire方法保存到 dict *expires对象当中。

  1. /*  
  2. * 这个函数是 EXPIRE 、 PEXPIRE 、 EXPIREAT 和 PEXPIREAT 命令的底层实现函数。 
  3. * 命令的第二个参数可能是绝对值,也可能是相对值。 
  4. * 当执行 *AT 命令时, basetime 为 0 ,在其他情况下,它保存的就是当前的绝对时间。 
  5. * unit 用于指定 argv[2] (传入过期时间)的格式, 
  6. * 它可以是 UNIT_SECONDS 或 UNIT_MILLISECONDS , 
  7. * basetime 参数则总是毫秒格式的。 
  8. */ 
  9. void expireGenericCommand(redisClient *c, long long basetime, int unit) { 
  10.    robj *key = c->argv[1], *param = c->argv[2]; 
  11.    long long when; /* unix time in milliseconds when the key will expire. */ 
  12.  
  13.    // 取出 when 参数 
  14.    if (getLongLongFromObjectOrReply(c, param, &whenNULL) != REDIS_OK) 
  15.        return
  16.  
  17.    // 如果传入的过期时间是以秒为单位的,那么将它转换为毫秒 
  18.    if (unit == UNIT_SECONDS) when *= 1000; 
  19.    when += basetime; 
  20.  
  21.    /* No keyreturn zero. */ 
  22.    // 取出键 
  23.    if (lookupKeyRead(c->db,key) == NULL) { 
  24.        addReply(c,shared.czero); 
  25.        return
  26.    } 
  27.  
  28.    /*  
  29.     * 在载入数据时,或者服务器为附属节点时, 
  30.     * 即使 EXPIRE 的 TTL 为负数,或者 EXPIREAT 提供的时间戳已经过期, 
  31.     * 服务器也不会主动删除这个键,而是等待主节点发来显式的 DEL 命令。 
  32.     * 
  33.     * 程序会继续将(一个可能已经过期的 TTL)设置为键的过期时间, 
  34.     * 并且等待主节点发来 DEL 命令。 
  35.     */ 
  36.    if (when <= mstime() && !server.loading && !server.masterhost) { 
  37.  
  38.        // when 提供的时间已经过期,服务器为主节点,并且没在载入数据 
  39.  
  40.        robj *aux; 
  41.  
  42.        redisAssertWithInfo(c,key,dbDelete(c->db,key)); 
  43.        server.dirty++; 
  44.  
  45.        /* Replicate/AOF this as an explicit DEL. */ 
  46.        // 传播 DEL 命令 
  47.        aux = createStringObject("DEL",3); 
  48.  
  49.        rewriteClientCommandVector(c,2,aux,key); 
  50.        decrRefCount(aux); 
  51.  
  52.        signalModifiedKey(c->db,key); 
  53.        notifyKeyspaceEvent(REDIS_NOTIFY_GENERIC,"del",key,c->db->id); 
  54.  
  55.        addReply(c, shared.cone); 
  56.  
  57.        return
  58.    } else { 
  59.  
  60.        // 设置键的过期时间 
  61.        // 如果服务器为附属节点,或者服务器正在载入, 
  62.        // 那么这个 when 有可能已经过期的 
  63.        setExpire(c->db,key,when); 
  64.  
  65.        addReply(c,shared.cone); 
  66.  
  67.        signalModifiedKey(c->db,key); 
  68.        notifyKeyspaceEvent(REDIS_NOTIFY_GENERIC,"expire",key,c->db->id); 
  69.  
  70.        server.dirty++; 
  71.  
  72.        return
  73.    } 
  74.  
  75.  setExpire函数主要是对db->expires中的key对应的dictEntry设置过期时间。 
  76.  
  77. /* 
  78. * 将键 key 的过期时间设为 when 
  79. */ 
  80. void setExpire(redisDb *db, robj *key, long long when) { 
  81.  
  82.    dictEntry *kde, *de; 
  83.  
  84.    /* Reuse the sds from the main dict in the expire dict */ 
  85.    // 取出键 
  86.    kde = dictFind(db->dict,key->ptr); 
  87.  
  88.    redisAssertWithInfo(NULL,key,kde != NULL); 
  89.  
  90.    // 根据键取出键的过期时间 
  91.    de = dictReplaceRaw(db->expires,dictGetKey(kde)); 
  92.  
  93.    // 设置键的过期时间 
  94.    // 这里是直接使用整数值来保存过期时间,不是用 INT 编码的 String 对象 
  95.    dictSetSignedIntegerVal(de,when); 

redis什么时候执行淘汰策略?

在redis种有三种删除的操作此策略

  • 定时删除:对于设有过期时间的key,时间到了,定时器任务立即执行删除
    • 因为要维护一个定时器,所以就会占用cpu资源,尤其是有过期时间的redis键越来越多损耗的性能就会线性上升
  • 惰性删除:每次只有再访问key的时候,才会检查key的过期时间,若是已经过期了就执行删除。
    • 这种情况只有在访问的时候才会删除,所以有可能有些过期的redis键一直不会被访问,就会一直占用redis内存
  • 定期删除:每隔一段时间,就会检查删除掉过期的key。
    • 这种方案相当于上述两种方案的折中,通过最合理控制删除的时间间隔来删除key,减少对cpu的资源的占用消耗,使删除操作合理化。

巨人的肩膀

https://www.jianshu.com/p/53083f5f2ddc https://zhuanlan.zhihu.com/p/265597517

 

责任编辑:武晓燕 来源: moon聊技术
相关推荐

2019-10-12 09:50:46

Redis内存数据库

2021-04-13 10:41:25

Redis内存数据库

2022-04-24 08:23:19

Redis内存淘汰策略

2020-07-17 21:15:08

Redis内存数据库

2024-10-08 10:13:17

2021-01-26 08:02:04

Redis内存数据库

2023-10-16 23:57:35

Redis内存

2024-09-03 09:20:45

2023-10-26 07:13:14

Redis内存淘汰

2020-03-18 19:00:29

电脑内存不足系统

2022-07-01 14:20:49

Redis策略函数

2019-04-10 10:43:15

Redis内存淘汰策略

2021-09-10 18:47:22

Redis淘汰策略

2021-10-30 19:01:17

磁盘字节文件

2011-07-28 13:45:06

2023-03-14 11:00:05

过期策略Redis

2017-05-31 12:52:55

大数据数据文件解决思路

2020-03-06 15:36:01

Redis内存宕机

2020-12-03 06:18:04

磁盘Docker容器

2021-03-10 10:40:04

Redis命令Linux
点赞
收藏

51CTO技术栈公众号