聊一聊Redis持久化开与关

开发 项目管理 Redis
Redis的持久化功能被夸大和误解了,这个问题我解释过无数遍了,早就想写个说明了,今天“忍不了”,和大家聊聊我的一些认知,欢迎大佬们吐槽。

本文转载自微信公众号「Redis开发运维实战」,作者付磊 。转载本文请联系Redis开发运维实战公众号。

经常能碰到这样的问题:

  1. A: Redis开持久化了吗? 
  2. B: 没有 
  3. A: 你们为什么不开?数据丢了怎么办?数据不一致怎么办? 

Redis的持久化功能被夸大和误解了,这个问题我解释过无数遍了,早就想写个说明了,今天“忍不了”,和大家聊聊我的一些认知,欢迎大佬们吐槽。

一、Redis”3“种持久化方式

1. RDB

简单来说,对Redis做一个快照(利用fork)保存在磁盘上

(1) 优点:

  • 结构紧凑体积小,加载速度快(相比AOF)
  • 可以做定期备份:例如低峰期(顺便搞个数据分析也行)

(2) 缺点:

  • 动作大、消耗大:全量操作对于磁盘、CPU、内存等均有消耗
  • 无法做到"实时"备份
  • 格式多变(Redis 3 4 5 6版本多次修改)

2. AOF

简单说把Redis的每条写操作记录到日志中,例如set hello world

  1. *3 
  2. $3 
  3. set 
  4. $5 
  5. hello 
  6. $5 
  7. world 

简单说,落盘策略有三种:

  1. appendfsync always:每次事件循环都进行一次同步操作(主线程) 
  2. appendfsync everysec:每秒进行一次同步操作(另一个线程) 
  3. appendfsync no:由操作系统控制同步操作(操作系统) 

(1) 优点:

  • RESP标准格式:无版本兼容性问题
  • 实时性更高且成本较小

(2) 缺点:

  • 体积大:协议 + 明文
  • 加载慢:利用fakeclient做回放
  • AOF重写还是动作不小(本文不讨论AOF重写)

3. RDB-AOF混合

持久化文件全量使用RDB,增量使用AOF,保证体积、实时性、加载速度。(Redis 4提供,本文不讨论)

二、开AOF性能会差多少?(注:AOF重写也是资源消耗大头,这里不讨论)

1.测试环境:

  • CPU: Intel(R) Xeon(R) Gold 6248 CPU @ 2.50GHz
  • 机械磁盘
  • Redis版本:4.0.14(未测试Redis 6多线程)
  • 压测工具:redis-benchmark
  • AOF策略:appendfsync everysec

2.压测方法:

测试Redis在”开和关“AOF情况下,在不同size(64字节、128字节、512字节)的OPS和耗时

(1) d=64字节

命令 ops(开AOF) ops(关AOF) 耗时(开AOF) 耗时(关AOF)
set 97352 121624 100.00% <= 0 milliseconds(总:5.14s) 100.00% <= 0 milliseconds(总:4.11s)
get 108979 109241 100.00% <= 0 milliseconds(总:4.59s) 100.00% <= 0 milliseconds(总:4.58s)
incr 104755 113301 100.00% <= 0 milliseconds(总:4.77s) 100.00% <= 0 milliseconds(总:4.41s)
lpush 95347 110889 100.00% <= 0 milliseconds(总:5.24s) 100.00% <= 0 milliseconds(总:4.51s)
hset 97770 113791 100.00% <= 0 milliseconds(总:5.11s) 100.00% <= 0 milliseconds(总:4.39s)

(2) d=128字节

命令 ops(开AOF) ops(关AOF) 耗时(开AOF) 耗时(关AOF)
set 108908 114077 100.00% <= 1 milliseconds
100.00% <= 2 milliseconds
(总:4.59s)
100.00% <= 0 milliseconds(总:4.38s)
get 107388 111756 100.00% <= 1 milliseconds(总:4.66s) 100.00% <= 0 milliseconds(总:4.47s)
incr 105042 113430 100.00% <= 0 milliseconds(总:4.76s) 100.00% <= 0 milliseconds(总:4.41s)
lpush 103114 114025 100.00% <= 0 milliseconds(总:4.85s) 100.00% <= 0 milliseconds(总:4.39s)
hset 101440 113791 100.00% <= 1 milliseconds(总:4.93s) 100.00% <= 1 milliseconds(总:4.93s)

(3) d=512字节

命令 ops(开AOF) ops(关AOF) 耗时(开AOF) 耗时(关AOF)
set 96581 108790 99.99% <= 1 milliseconds
99.99% <= 2 milliseconds
99.99% <= 3 milliseconds
99.99% <= 5 milliseconds
100.00% <= 6 milliseconds
100.00% <= 7 milliseconds
100.00% <= 8 milliseconds
100.00% <= 8 milliseconds
(总:5.18s)
100.00% <= 1 milliseconds(总:4.60s)
get 107898 105374 100.00% <= 0 milliseconds(总:4.63s) 100.00% <= 0 milliseconds(总:4.74s)
incr 102438 107991 100.00% <= 0 milliseconds(总:4.88s) 100.00% <= 0 milliseconds(总:4.63s)
lpush 93231 105064 99.98% <= 2 milliseconds
99.98% <= 3 milliseconds
99.99% <= 4 milliseconds
99.99% <= 5 milliseconds
99.99% <= 6 milliseconds
100.00% <= 7 milliseconds
100.00% <= 8 milliseconds
100.00% <= 8 milliseconds
(总:5.36s)
100.00% <= 0 milliseconds(总:4.76s)
hset 96955 108225 100.00% <= 6 milliseconds
100.00% <= 8 milliseconds
100.00% <= 9 milliseconds
100.00% <= 9 milliseconds
(总:5.16s)
100.00% <= 0 milliseconds(总:4.62s)

3. 总结说明:(注意此处没有考虑AOF重写,只能更差)

(1) 开启AOF后,Redis的写性能下降了8~25%,读性能未下降(注意此处测试为非读写混合场景)

(2) 开启AOF后,随着数据量的增加相关读写性能会下降。

(3) 开启AOF后,实际测试中发现单核CPU也会少量上涨。

三、一些问题的讨论?

1. aof刷盘策略改为always能保证不丢数据吗?

(1) 答案

会丢。Redis执行一条写入命令时,会将数据写入aof_buf,但写入aof_buf和刷盘还是存在一次事件时间差。

(2) 原理:

Redis处理命令(server.c)processCommand->call(执行命令),其中包含

  1. void propagate(struct redisCommand *cmd, int dbid, robj **argv, int argc, int flags) 
  2.    //写入到aof_buf中 
  3.     if (server.aof_state != AOF_OFF && flags & PROPAGATE_AOF) 
  4.         feedAppendOnlyFile(cmd,dbid,argv,argc); 
  5.     ...... 

每次文件事件前的beforesleep(ae.c)

  1. void aeMain(aeEventLoop *eventLoop) { 
  2.     eventLoop->stop = 0; 
  3.     while (!eventLoop->stop) { 
  4.         if (eventLoop->beforesleep != NULL
  5.             eventLoop->beforesleep(eventLoop); 
  6.         aeProcessEvents(eventLoop, AE_ALL_EVENTS|AE_CALL_AFTER_SLEEP); 
  7.     } 

其中beforesleep包含了aof_buf落盘(server.c)

  1. void beforeSleep(struct aeEventLoop *eventLoop) { 
  2.   ...... 
  3.    //aof落盘 
  4.     flushAppendOnlyFile(0); 
  5.     ...... 

flushAppendOnlyFile利用操作系统的write和fsync(加上aof的三种策略)完成落盘:

2.Redis是什么一致性?

最终一致性。客户端写主后,不等从写完。(为什么这样?Redis设计目标是什么?快!)

3.master节点故障后Redis怎么恢复?

(1) 关闭AOF:B节点晋升成主节点,对外提供服务。A节点恢复后变为slave,依赖全量复制获取全部数据

(2) 开启AOF:同上...(只不过A节点全量复制后做一次AOF重写)

所以看起来此模式下,对于故障恢复持久化没什么用!

4.我就不想丢理论上最少的数据,怎么办?

开启always,不用主从切换,等待A节点恢复,重新加载AOF在提供服务,老哥这个现实吗???

五、最佳实践?

1.RDB最佳

(1) 自动save:关、关、关(性能杀手)

(2) save命令:同步,忘记它(除非你一点内存没有了,还需要RDB)

(3) bgsave命令:备份可以用,请关注fork时间(info stats可查)

(4) 关闭掉:做不到,因为全量复制默认会用。

2.AOF最佳

(1) always不要用(主线程执行、以及IO影响)

(2) everysec、no按需使用,如果仅仅想不丢数据,AOF做不到。

(3) 除非怕主从都挂了,可以考虑。

不要忘记AOF臭名昭著的:

  1. Asynchronous AOF fsync is taking too long (disk is busy). Writing the AOF buffer without waiting for fsync to complete, this may slow down Redis 

3.单机多实例:你玩得起吗?

以一个80 core,500G内存的机器为例子,出于成本考虑至少要部署80~90个* memory(5G)的实例。在此场景下CPU、内存、网络的开销基本还能控制,但如果开了AOF,用普通的磁盘,行不行?

  1. 会有:很多公司会为了做持久化,预留“一半”内存,所以就是40~45个 
  2.  
  3. 还有:用SSD解决AOF的问题。 

4. "旁门左道"用法

(1) RDB:

定期备份(例如低峰期)、数据分析(分析出bigkey、hotkey、idlekey等)(阿里云的做法)

(2) AOF

原生AOF语义太弱,如果想做类似binlog功能可以对Redis内核进行修改,多机房同步会用上。

六、总结

Redis的持久化功能是一个重要功能,但如果想指望它实现“不丢数据”、“一致性”,那可能带来的就是:低性能、高成本。

有时间整理下Redis3~6 AOF的一些变化,附图一张:继续搬砖去了(现在实例已经130万了。。)

 

责任编辑:武晓燕 来源: Redis开发运维实战
相关推荐

2022-08-30 10:15:27

Kubernetes数据持久化管理

2022-03-08 16:10:38

Redis事务机制

2022-05-12 23:19:15

Redis内存碎片处理

2023-03-06 21:23:23

Redis数据库

2020-04-24 09:53:59

Go协作抢占

2022-05-18 16:35:43

Redis内存运维

2021-09-15 14:52:43

数字货币传销虚拟货币

2023-09-27 09:04:50

2018-03-23 10:30:56

微网关服务啮合微服务

2021-03-10 00:02:01

Redis

2022-03-31 10:41:35

iOS应用提审发布

2018-06-07 13:17:12

契约测试单元测试API测试

2023-09-22 17:36:37

2021-01-28 22:31:33

分组密码算法

2020-05-22 08:16:07

PONGPONXG-PON

2020-09-08 06:54:29

Java Gradle语言

2021-01-01 09:01:05

前端组件化设计

2020-06-28 09:30:37

Linux内存操作系统

2020-08-12 08:34:16

开发安全We

2022-10-08 11:33:56

边缘计算云计算
点赞
收藏

51CTO技术栈公众号