详解 Redis 内存管理机制和实现

存储 存储软件 Redis
Redis是一个基于内存的键值数据库,其内存管理是非常重要的。本文内存管理的内容包括:过期键的懒性删除和过期删除以及内存溢出控制策略。

[[338410]]

本文转载自微信公众号「程序员历小冰」,作者历小冰 。转载本文请联系程序员历小冰公众号。   

 Redis是一个基于内存的键值数据库,其内存管理是非常重要的。本文内存管理的内容包括:过期键的懒性删除和过期删除以及内存溢出控制策略。

最大内存限制

Redis使用 maxmemory 参数限制最大可用内存,默认值为0,表示无限制。限制内存的目的主要 有:

  • 用于缓存场景,当超出内存上限 maxmemory 时使用 LRU 等删除策略释放空间。
  • 防止所用内存超过服务器物理内存。因为 Redis 默认情况下是会尽可能多使用服务器的内存,可能会出现服务器内存不足,导致 Redis 进程被杀死。

 

maxmemory 限制的是Redis实际使用的内存量,也就是 used_memory统计项对应的内存。由于内存碎片率的存在,实际消耗的内存 可能会比maxmemory设置的更大,实际使用时要小心这部分内存溢出。具体Redis 内存监控的内容请查看一文了解 Redis 内存监控和内存消耗。

Redis默认无限使用服务器内存,为防止极端情况下导致系统内存耗 尽,建议所有的Redis进程都要配置maxmemory。在保证物理内存可用的情况下,系统中所有Redis实例可以调整 maxmemory参数来达到自由伸缩内存的目的。

内存回收策略

Redis 回收内存大致有两个机制:一是删除到达过期时间的键值对象;二是当内存达到 maxmemory 时触发内存移除控制策略,强制删除选择出来的键值对象。

删除过期键对象

Redis 所有的键都可以设置过期属性,内部保存在过期表中,键值表和过期表的结果如下图所示。当 Redis保存大量的键,对每个键都进行精准的过期删除可能会导致消耗大量的 CPU,会阻塞 Redis 的主线程,拖累 Redis 的性能,因此 Redis 采用惰性删除和定时任务删除机制实现过期键的内存回收。

 

惰性删除是指当客户端操作带有超时属性的键时,会检查是否超过键的过期时间,然后会同步或者异步执行删除操作并返回键已经过期。这样可以节省 CPU成本考虑,不需要单独维护过期时间链表来处理过期键的删除。

过期键的惰性删除策略由 db.c/expireifNeeded 函数实现,所有对数据库的读写命令执行之前都会调用 expireifNeeded 来检查命令执行的键是否过期。如果键过期,expireifNeeded 会将过期键从键值表和过期表中删除,然后同步或者异步释放对应对象的空间。源码展示的时 Redis 4.0 版本。

expireIfNeeded 先从过期表中获取键对应的过期时间,如果当前时间已经超过了过期时间(lua脚本执行则有特殊逻辑,详看代码注释),则进入删除键流程。删除键流程主要进行了三件事:

  • 一是删除操作命令传播,通知 slave 实例并存储到 AOF 缓冲区中
  • 二是记录键空间事件,
  • 三是根据 lazyfreelazyexpire 是否开启进行异步删除或者异步删除操作。
  1. int expireIfNeeded(redisDb *db, robj *key) { 
  2.  
  3. // 获取键的过期时间 
  4.  
  5. mstime_t when = getExpire(db,key); 
  6.  
  7. mstime_t now; 
  8.  
  9. // 键没有过期时间 
  10.  
  11. if (when < 0) return 0; 
  12.  
  13. // 实例正在从硬盘 laod 数据,比如说 RDB 或者 AOF 
  14.  
  15. if (server.loading) return 0; 
  16.  
  17.  
  18.  
  19.  
  20. // 当执行lua脚本时,只有键在lua一开始执行时 
  21.  
  22. // 就到了过期时间才算过期,否则在lua执行过程中不算失效 
  23.  
  24. now = server.lua_caller ? server.lua_time_start : mstime(); 
  25.  
  26.  
  27.  
  28.  
  29. // 当本实例是slave时,过期键的删除由master发送过来的 
  30.  
  31. // del 指令控制。但是这个函数还是将正确的信息返回给调用者。 
  32.  
  33. if (server.masterhost != NULLreturn now > when
  34.  
  35. // 判断是否未过期 
  36.  
  37. if (now <= whenreturn 0; 
  38.  
  39.  
  40.  
  41.  
  42. // 代码到这里,说明键已经过期,而且需要被删除 
  43.  
  44. server.stat_expiredkeys++; 
  45.  
  46. // 命令传播,到 slave 和 AOF 
  47.  
  48. propagateExpire(db,key,server.lazyfree_lazy_expire); 
  49.  
  50. // 键空间通知使得客户端可以通过订阅频道或模式, 来接收那些以某种方式改动了 Redis 数据集的事件。 
  51.  
  52. notifyKeyspaceEvent(NOTIFY_EXPIRED, 
  53.  
  54. "expired",key,db->id); 
  55.  
  56. // 如果是惰性删除,调用dbAsyncDelete,否则调用 dbSyncDelete 
  57.  
  58. return server.lazyfree_lazy_expire ? dbAsyncDelete(db,key) : 
  59.  
  60. dbSyncDelete(db,key); 
  61.  

 

上图是写命令传播的示意图,删除命令的传播和它一致。propagateExpire 函数先调用 feedAppendOnlyFile 函数将命令同步到 AOF 的缓冲区中,然后调用 replicationFeedSlaves函数将命令同步到所有的 slave 中。Redis 复制的机制可以查看Redis 复制过程详解。

  1. // 将命令传递到slave和AOF缓冲区。maser删除一个过期键时会发送Del命令到所有的slave和AOF缓冲区 
  2.  
  3. void propagateExpire(redisDb *db, robj *keyint lazy) { 
  4.  
  5. robj *argv[2]; 
  6.  
  7. // 生成同步的数据 
  8.  
  9. argv[0] = lazy ? shared.unlink : shared.del; 
  10.  
  11. argv[1] = key
  12.  
  13. incrRefCount(argv[0]); 
  14.  
  15. incrRefCount(argv[1]); 
  16.  
  17. // 如果开启了 AOF 则追加到 AOF 缓冲区中 
  18.  
  19. if (server.aof_state != AOF_OFF) 
  20.  
  21. feedAppendOnlyFile(server.delCommand,db->id,argv,2); 
  22.  
  23. // 同步到所有 slave 
  24.  
  25. replicationFeedSlaves(server.slaves,db->id,argv,2); 
  26.  
  27.  
  28.  
  29.  
  30. decrRefCount(argv[0]); 
  31.  
  32. decrRefCount(argv[1]); 
  33.  

dbAsyncDelete 函数会先调用 dictDelete 来删除过期表中的键,然后处理键值表中的键值对象。它会根据值的占用的空间来选择是直接释放值对象,还是交给 bio 异步释放值对象。判断依据就是值的估计大小是否大于 LAZYFREE_THRESHOLD 阈值。键对象和 dictEntry 对象则都是直接被释放。


 

  1. #define LAZYFREE_THRESHOLD 64 
  2.  
  3. int dbAsyncDelete(redisDb *db, robj *key) { 
  4.  
  5. // 删除该键在过期表中对应的entry 
  6.  
  7. if (dictSize(db->expires) > 0) dictDelete(db->expires,key->ptr); 
  8.  
  9.  
  10.  
  11.  
  12. // unlink 该键在键值表对应的entry 
  13.  
  14. dictEntry *de = dictUnlink(db->dict,key->ptr); 
  15.  
  16. // 如果该键值占用空间非常小,懒删除反而效率低。所以只有在一定条件下,才会异步删除 
  17.  
  18. if (de) { 
  19.  
  20. robj *val = dictGetVal(de); 
  21.  
  22. size_t free_effort = lazyfreeGetFreeEffort(val); 
  23.  
  24. // 如果释放这个对象消耗很多,并且值未被共享(refcount == 1)则将其加入到懒删除列表 
  25.  
  26. if (free_effort > LAZYFREE_THRESHOLD && val->refcount == 1) { 
  27.  
  28. atomicIncr(lazyfree_objects,1); 
  29.  
  30. bioCreateBackgroundJob(BIO_LAZY_FREE,val,NULL,NULL); 
  31.  
  32. dictSetVal(db->dict,de,NULL); 
  33.  
  34.  
  35.  
  36.  
  37.  
  38.  
  39. // 释放键值对,或者只释放key,而将val设置为NULL来后续懒删除 
  40.  
  41. if (de) { 
  42.  
  43. dictFreeUnlinkedEntry(db->dict,de); 
  44.  
  45. // slot 和 key 的映射关系是用于快速定位某个key在哪个 slot中。 
  46.  
  47. if (server.cluster_enabled) slotToKeyDel(key); 
  48.  
  49. return 1; 
  50.  
  51. else { 
  52.  
  53. return 0; 
  54.  
  55.  

dictUnlink 会将键值从键值表中删除,但是却不释放 key、val和对应的表entry对象,而是将其直接返回,然后再调用dictFreeUnlinkedEntry进行释放。dictDelete 是它的兄弟函数,但是会直接释放相应的对象。二者底层都通过调用 dictGenericDelete来实现。dbAsyncDelete d的兄弟函数 dbSyncDelete 就是直接调用dictDelete来删除过期键。

  1. void dictFreeUnlinkedEntry(dict *d, dictEntry *he) { 
  2.  
  3. if (he == NULLreturn
  4.  
  5. // 释放key对象 
  6.  
  7. dictFreeKey(d, he); 
  8.  
  9. // 释放值对象,如果它不为null 
  10.  
  11. dictFreeVal(d, he); 
  12.  
  13. // 释放 dictEntry 对象 
  14.  
  15. zfree(he); 
  16.  

Redis 有自己的 bio 机制,主要是处理 AOF 落盘、懒删除逻辑和关闭大文件fd。bioCreateBackgroundJob 函数将释放值对象的 job 加入到队列中,bioProcessBackgroundJobs会从队列中取出任务,根据类型进行对应的操作。

  1. void *bioProcessBackgroundJobs(void *arg) { 
  2.  
  3. ..... 
  4.  
  5. while(1) { 
  6.  
  7. listNode *ln; 
  8.  
  9.  
  10.  
  11.  
  12. ln = listFirst(bio_jobs[type]); 
  13.  
  14. job = ln->value; 
  15.  
  16. if (type == BIO_CLOSE_FILE) { 
  17.  
  18. close((long)job->arg1); 
  19.  
  20. else if (type == BIO_AOF_FSYNC) { 
  21.  
  22. aof_fsync((long)job->arg1); 
  23.  
  24. else if (type == BIO_LAZY_FREE) { 
  25.  
  26. // 根据参数来决定要做什么。有参数1则要释放它, 
  27.  
  28. // 有参数2和3是释放两个键值表 
  29.  
  30. // 过期表,也就是释放db 只有参数三是释放跳表 
  31.  
  32. if (job->arg1) 
  33.  
  34. lazyfreeFreeObject 
  35.  
  36. FromBioThread(job->arg1); 
  37.  
  38. else if (job->arg2 && job->arg3) 
  39.  
  40. lazyfreeFreeDatabase 
  41.  
  42. FromBioThread(job->arg2,job->arg3); 
  43.  
  44. else if (job->arg3) 
  45.  
  46. lazyfreeFreeSlotsMap 
  47.  
  48. FromBioThread(job->arg3); 
  49.  
  50.  
  51. zfree(job); 
  52.  
  53. ...... 
  54.  
  55.  

dbSyncDelete 则是直接删除过期键,并且将键、值和 DictEntry 对象都释放。

  1. int dbSyncDelete(redisDb *db, robj *key) { 
  2.  
  3. // 删除过期表中的entry 
  4.  
  5. if (dictSize(db->expires) > 0) dictDelete(db->expires,key->ptr); 
  6.  
  7. // 删除键值表中的entry 
  8.  
  9. if (dictDelete(db->dict,key->ptr) == DICT_OK) { 
  10.  
  11. // 如果开启了集群,则删除slot 和 key 映射表中key记录。 
  12.  
  13. if (server.cluster_enabled) slotToKeyDel(key); 
  14.  
  15. return 1; 
  16.  
  17. else { 
  18.  
  19. return 0; 
  20.  
  21.  

但是单独用这种方式存在内存泄露的问题,当过期键一直没有访问将无法得到及时删除,从而导致内存不能及时释放。正因为如此,Redis还提供另一种定时任 务删除机制作为惰性删除的补充。

Redis 内部维护一个定时任务,默认每秒运行10次(通过配置控制)。定时任务中删除过期键逻辑采用了自适应算法,根据键的 过期比例、使用快慢两种速率模式回收键,流程如下图所示。


 

 

  • 1)定时任务首先根据快慢模式( 慢模型扫描的键的数量以及可以执行时间都比快模式要多 )和相关阈值配置计算计算本周期最大执行时间、要检查的数据库数量以及每个数据库扫描的键数量。
  • 2) 从上次定时任务未扫描的数据库开始,依次遍历各个数据库。
  • 3)从数据库中随机选手 ACTIVEEXPIRECYCLELOOKUPSPER_LOOP 个键,如果发现是过期键,则调用 activeExpireCycleTryExpire 函数删除它。
  • 4)如果执行时间超过了设定的最大执行时间,则退出,并设置下一次使用慢模式执行。
  • 5)未超时的话,则判断是否采样的键中是否有25%的键是过期的,如果是则继续扫描当前数据库,跳到第3步。否则开始扫描下一个数据库。

定期删除策略由 expire.c/activeExpireCycle 函数实现。在redis事件驱动的循环中的eventLoop->beforesleep和 周期性操作 databasesCron 都会调用 activeExpireCycle 来处理过期键。但是二者传入的 type 值不同,一个是ACTIVEEXPIRECYCLESLOW 另外一个是ACTIVEEXPIRECYCLEFAST。activeExpireCycle 在规定的时间,分多次遍历各个数据库,从 expires 字典中随机检查一部分过期键的过期时间,删除其中的过期键,相关源码如下所示。

  1. void activeExpireCycle(int type) { 
  2.  
  3. // 上次检查的db 
  4.  
  5. static unsigned int current_db = 0;  
  6.  
  7. // 上次检查的最大执行时间 
  8.  
  9. static int timelimit_exit = 0; 
  10.  
  11. // 上一次快速模式运行时间 
  12.  
  13. static long long last_fast_cycle = 0; /* When last fast cycle ran. */ 
  14.  
  15.  
  16.  
  17.  
  18. int j, iteration = 0; 
  19.  
  20. // 每次检查周期要遍历的DB数 
  21.  
  22. int dbs_per_call = CRON_DBS_PER_CALL; 
  23.  
  24. long long start = ustime(), timelimit, elapsed; 
  25.  
  26.  
  27.  
  28.  
  29. ..... // 一些状态时不进行检查,直接返回 
  30.  
  31.  
  32.  
  33.  
  34. // 如果上次周期因为执行达到了最大执行时间而退出,则本次遍历所有db,否则遍历db数等于 CRON_DBS_PER_CALL 
  35.  
  36. if (dbs_per_call > server.dbnum || timelimit_exit) 
  37.  
  38. dbs_per_call = server.dbnum; 
  39.  
  40.  
  41.  
  42.  
  43. // 根据ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC计算本次最大执行时间 
  44.  
  45. timelimit = 1000000*ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC/server.hz/100; 
  46.  
  47. timelimit_exit = 0; 
  48.  
  49. if (timelimit <= 0) timelimit = 1; 
  50.  
  51. // 如果是快速模式,则最大执行时间为ACTIVE_EXPIRE_CYCLE_FAST_DURATION 
  52.  
  53. if (type == ACTIVE_EXPIRE_CYCLE_FAST) 
  54.  
  55. timelimit = ACTIVE_EXPIRE_CYCLE_FAST_DURATION; /* in microseconds. */ 
  56.  
  57. // 采样记录 
  58.  
  59. long total_sampled = 0; 
  60.  
  61. long total_expired = 0; 
  62.  
  63. // 依次遍历 dbs_per_call 个 db 
  64.  
  65. for (j = 0; j < dbs_per_call && timelimit_exit == 0; j++) { 
  66.  
  67. int expired; 
  68.  
  69. redisDb *db = server.db+(current_db % server.dbnum); 
  70.  
  71. // 将db数增加,一遍下一次继续从这个db开始遍历 
  72.  
  73. current_db++; 
  74.  
  75.  
  76.  
  77.  
  78. do { 
  79.  
  80. ..... // 申明变量和一些情况下 break 
  81.  
  82. if (num > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP) 
  83.  
  84. num = ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP; 
  85.  
  86. // 主要循环,在过期表中进行随机采样,判断是否比率大于25% 
  87.  
  88. while (num--) { 
  89.  
  90. dictEntry *de; 
  91.  
  92. long long ttl; 
  93.  
  94.  
  95.  
  96.  
  97. if ((de = dictGetRandomKey(db->expires)) == NULL) break; 
  98.  
  99. ttl = dictGetSignedIntegerVal(de)-now; 
  100.  
  101. // 删除过期键 
  102.  
  103. if (activeExpireCycleTryExpire(db,de,now)) expired++; 
  104.  
  105. if (ttl > 0) { 
  106.  
  107. /* We want the average TTL of keys yet not expired. */ 
  108.  
  109. ttl_sum += ttl; 
  110.  
  111. ttl_samples++; 
  112.  
  113.  
  114. total_sampled++; 
  115.  
  116.  
  117. // 记录过期总数 
  118.  
  119. total_expired += expired; 
  120.  
  121. // 即使有很多键要过期,也不阻塞很久,如果执行超过了最大执行时间,则返回 
  122.  
  123. if ((iteration & 0xf) == 0) { /* check once every 16 iterations. */ 
  124.  
  125. elapsed = ustime()-start; 
  126.  
  127. if (elapsed > timelimit) { 
  128.  
  129. timelimit_exit = 1; 
  130.  
  131. server.stat_expired_time_cap_reached_count++; 
  132.  
  133. break; 
  134.  
  135.  
  136.  
  137. // 当比率小于25%时返回 
  138.  
  139. } while (expired > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP/4); 
  140.  
  141.  
  142. .....// 更新一些server的记录数据 
  143.  

activeExpireCycleTryExpire 函数的实现就和 expireIfNeeded 类似,这里就不赘述了。

  1. int activeExpireCycleTryExpire(redisDb *db, dictEntry *de, long long now) { 
  2.  
  3. long long t = dictGetSignedIntegerVal(de); 
  4.  
  5. if (now > t) { 
  6.  
  7. sds key = dictGetKey(de); 
  8.  
  9. robj *keyobj = createStringObject(key,sdslen(key)); 
  10.  
  11.  
  12.  
  13.  
  14. propagateExpire(db,keyobj,server.lazyfree_lazy_expire); 
  15.  
  16. if (server.lazyfree_lazy_expire) 
  17.  
  18. dbAsyncDelete(db,keyobj); 
  19.  
  20. else 
  21.  
  22. dbSyncDelete(db,keyobj); 
  23.  
  24. notifyKeyspaceEvent(NOTIFY_EXPIRED, 
  25.  
  26. "expired",keyobj,db->id); 
  27.  
  28. decrRefCount(keyobj); 
  29.  
  30. server.stat_expiredkeys++; 
  31.  
  32. return 1; 
  33.  
  34. else { 
  35.  
  36. return 0; 
  37.  
  38.  

定期删除策略的关键点就是删除操作执行的时长和频率:

  • 如果删除操作太过频繁或者执行时间太长,就对 CPU 时间不是很友好,CPU 时间过多的消耗在删除过期键上。
  • 如果删除操作执行太少或者执行时间太短,就不能及时删除过期键,导致内存浪费。

内存溢出控制策略

当Redis所用内存达到maxmemory上限时会触发相应的溢出控制策略。具体策略受maxmemory-policy参数控制,Redis支持6种策略,如下所示:

  • 1)noeviction:默认策略,不会删除任何数据,拒绝所有写入操作并返 回客户端错误信息(error)OOM command not allowed when used memory,此 时Redis只响应读操作。
  • 2)volatile-lru:根据LRU算法删除设置了超时属性(expire)的键,直 到腾出足够空间为止。如果没有可删除的键对象,回退到noeviction策略。
  • 3)allkeys-lru:根据LRU算法删除键,不管数据有没有设置超时属性, 直到腾出足够空间为止。
  • 4)allkeys-random:随机删除所有键,直到腾出足够空间为止。
  • 5)volatile-random:随机删除过期键,直到腾出足够空间为止。
  • 6)volatile-ttl:根据键值对象的ttl属性,删除最近将要过期数据。如果没有,回退到noeviction策略。

内存溢出控制策略可以使用 config set maxmemory-policy {policy} 语句进行动态配置。Redis 提供了丰富的空间溢出控制策略,我们可以根据自身业务需要进行选择。

当设置 volatile-lru 策略时,保证具有过期属性的键可以根据 LRU 剔除,而未设置超时的键可以永久保留。还可以采用allkeys-lru 策略把 Redis 变为纯缓存服务器使用。

当Redis因为内存溢出删除键时,可以通过执行 info stats 命令查看 evicted_keys 指标找出当前 Redis 服务器已剔除的键数量。

每次Redis执行命令时如果设置了maxmemory参数,都会尝试执行回收 内存操作。当Redis一直工作在内存溢出(used_memory>maxmemory)的状态下且设置非 noeviction 策略时,会频繁地触发回收内存的操作,影响Redis 服务器的性能,这一点千万要引起注意。

 

责任编辑:武晓燕 来源: 程序员历小冰
相关推荐

2010-09-26 13:23:13

JVM内存管理机制

2010-12-10 15:40:58

JVM内存管理

2011-06-29 17:20:20

Qt 内存 QOBJECT

2009-09-02 09:23:26

.NET内存管理机制

2013-09-29 15:11:46

Linux运维内存管理

2010-07-23 09:34:48

Python

2022-06-01 16:01:58

MySQL内存管理系统

2009-07-08 15:10:00

Servlet会话管理

2021-02-07 09:02:28

内存管理length

2020-11-08 14:32:01

JavaScript变量内存管理

2022-02-28 10:25:17

Python参数传递拷贝

2016-10-09 14:41:40

Swift开发ARC

2019-01-23 17:08:52

Python内存管理RealPython

2011-08-18 13:28:35

Objective-C内存

2009-10-22 17:39:34

CLR内存管理

2023-05-05 11:25:29

秘钥架构机制

2010-09-27 13:26:31

JVM内存管理机制

2010-01-06 10:23:47

.NET Framew

2019-11-12 14:15:07

Redis内存持久化

2009-12-29 09:53:25

NHibernate缓
点赞
收藏

51CTO技术栈公众号