腾讯音乐:说说Redis脑裂问题?

数据库 Redis
在 Redis 哨兵模式或集群模式中,由于网络原因,导致主节点(Master)与哨兵(Sentinel)和从节点(Slave)的通讯中断,此时哨兵就会误以为主节点已宕机,就会在从节点中选举出一个新的主节点,此时 Redis 的集群中就出现了两个主节点的问题,就是 Redis 脑裂问题。

Redis 脑裂问题是指,在 Redis 哨兵模式或集群模式中,由于网络原因,导致主节点(Master)与哨兵(Sentinel)和从节点(Slave)的通讯中断,此时哨兵就会误以为主节点已宕机,就会在从节点中选举出一个新的主节点,此时 Redis 的集群中就出现了两个主节点的问题,就是 Redis 脑裂问题。

脑裂问题影响

Redis 脑裂问题会导致数据丢失,为什么呢?来看脑裂问题产生的过程:

而最后一步,当旧的 Master 变为 Slave 之后,它的执行流程如下:

  • Slave(旧 Master)会向 Master(新)申请全量数据。
  • Master 会通过 bgsave 的方式生成当前 RDB 快照,并将 RDB 发送给 Slave。
  • Slave 拿到 RDB 之后,先进行 flush 清空当前数据(此时第四步旧客户端给他的发送的数据就丢失了)。
  • 之后再加载 RDB 数据,初始化自己当前的数据。

从以上过程中可以看出,在执行到第三步的时候,原客户端在旧 Master 写入的数据就丢失了,这就是数据丢失的问题。

如何解决脑裂问题?

脑裂问题只需要在旧 Master 恢复网络之后,切换身份为 Slave 期间,不接收客户端的数据写入即可,那怎么解决这个问题呢?

Redis 为我们提供了以下两个配置,通过以下两个配置可以尽可能的避免数据丢失的问题:

  • min-slaves-to-write:与主节点通信的从节点数量必须大于等于该值主节点,否则主节点拒绝写入。
  • min-slaves-max-lag:主节点与从节点通信的 ACK 消息延迟必须小于该值,否则主节点拒绝写入。

这两个配置项必须同时满足,不然主节点拒绝写入。

在假故障期间满足 min-slaves-to-write 和 min-slaves-max-lag 的要求,那么主节点就会被禁止写入,脑裂造成的数据丢失情况自然也就解决了。

责任编辑:姜华 来源: 磊哥和Java
相关推荐

2024-04-18 08:00:00

脑裂问题Redis哨兵模式

2024-09-29 08:47:55

2025-01-13 00:00:00

配置Redis脑裂

2017-09-02 16:23:45

AWSAZ群集

2020-10-27 11:50:53

运维Zookeeper脑裂

2019-11-29 11:12:56

Zookeeper脑裂选举算法

2024-06-17 08:24:09

2022-06-20 05:25:54

裂脑Oracle RAC数据库

2024-02-27 09:48:25

Redis集群数据库

2017-12-09 09:00:12

腾讯Spotify

2021-07-29 06:56:36

分布式系统脑裂

2022-07-07 07:51:00

数据中心存储层脑裂

2020-07-21 14:24:11

人工智能脑机接口技术

2022-10-27 21:32:34

oracle数据库

2023-05-15 08:02:33

Kafka选举Broker

2024-06-11 00:01:00

并发validate场景

2020-09-10 16:30:18

腾讯数字生态操作系统

2013-03-19 09:33:46

项目

2017-10-18 08:24:11

存储双活脑裂风险

2015-12-02 15:35:08

Redis Clust迁移解决方案
点赞
收藏

51CTO技术栈公众号