🌟 Redis哨兵机制实战:保证Redis高可用性的解决方案
🍊 一、Redis哨兵机制简介
Redis哨兵机制是Redis的高可用解决方案之一,可以监控和管理Redis集群中的多个节点,并在发现主节点出现宕机等异常情况时,自动将从节点提升为主节点,继续提供服务。这个过程是自动化的,不需要人为干预,所以能够有效提高Redis的可用性和稳定性,避免因主节点宕机而导致业务受到影响。
🍊 二、Redis哨兵机制实战
🎉 1. 创建Redis集群
首先需要创建Redis集群,这里以3个节点的Redis集群为例,可以使用Docker搭建:
# 创建Redis主节点 docker run -d --name redis-master -p 6379:6379 redis redis-server --appendonly yes # 创建Redis从节点1 docker run -d --name redis-slave1 -p 6380:6379 redis redis-server --appendonly yes --slaveof redis-master 6379 # 创建Redis从节点2 docker run -d --name redis-slave2 -p 6381:6379 redis redis-server --appendonly yes --slaveof redis-master 6379
上述命令分别创建了一个Redis主节点和两个Redis从节点,其中从节点1和从节点2都是主节点的从节点。这里用到了Redis的--slaveof
参数,表示从节点1和从节点2是主节点6379的从节点。
🎉 2. 下载并安装Redis哨兵
下载Redis哨兵,下载地址为:https://github.com/redis/redis/archive/5.0.9.tar.gz
解压后进入解压后的目录,执行以下命令安装Redis哨兵:
make SENTINEL=yes
安装成功后,可以在src
目录下找到redis-sentinel
可执行文件。
🎉 3. 配置Redis哨兵
Redis哨兵的配置文件为sentinel.conf
,可以使用以下命令生成默认配置文件:
./redis-sentinel sentinel.conf
可以使用编辑器打开sentinel.conf
配置文件,修改以下配置项:
# 监控的Redis集群名称,自定义 sentinel monitor myredis redis-master 6379 2 # 故障判断次数,如果连续2次无法ping通主节点,则视为主节点不可用 sentinel down-after-milliseconds myredis 5000 # 超时判断次数,如果连续3次无法ping通主节点,则对主节点进行切换 sentinel failover-timeout myredis 15000 # 主节点故障后,最多可以切换到新的主节点的从节点数量 sentinel parallel-syncs myredis 1 # 集群的IP和端口号,可以设置多个 # 第1个参数为Redis节点的别名,自定义,需要唯一 # 第2个参数为Redis节点的IP # 第3个参数为Redis节点的端口号 sentinel monitor myredis redis-master 6379 2 sentinel monitor myredis redis-slave1 6380 2 sentinel monitor myredis redis-slave2 6381 2
配置完成后,保存并退出。
🎉 4. 启动Redis哨兵
使用以下命令启动Redis哨兵:
./redis-sentinel sentinel.conf
这样就启动了Redis哨兵,它会自动监控Redis集群中的多个节点。
🎉 5. 测试Redis哨兵
可以通过向Redis集群中写入数据,来测试Redis哨兵的自动化主从切换功能。使用以下命令连接到Redis主节点:
redis-cli -h 127.0.0.1 -p 6379
连接成功后,使用以下命令设置一个Redis键值对:
set foo bar
接着可以通过以下命令查看Redis主从节点的状态:
# 查看Redis主节点的信息 info replication # 查看Redis从节点的信息 info replication
可以看到Redis主节点的状态正常,而Redis从节点的状态也正常,说明Redis哨兵起到了作用。
🎉 6. 模拟主节点宕机
为了测试Redis哨兵的自动化主从切换功能,需要模拟主节点宕机的情况。可以使用以下命令停止Redis主节点:
docker stop redis-master
此时Redis主节点已经停止,可以通过以下命令查看Redis从节点的状态:
# 查看Redis从节点1的信息 info replication # 查看Redis从节点2的信息 info replication
可以看到Redis从节点1已经被自动切换为主节点,而Redis从节点2已经更新为从节点,Redis集群已经恢复正常运行。
Redis哨兵机制是一种非常有效的保证Redis高可用性的解决方案,能够自动监控和管理Redis集群中的多个节点,并在发现主节点宕机等异常情况时,自动实现主从切换,维护Redis集群的稳定性和可用性。通过本文的介绍,相信读者已经掌握了Redis哨兵机制的实战使用步骤与配置,希望对大家有所帮助。
🍊 三、底层工作原理
哨兵机制是Redis的一个分布式系统,可以运行多个哨兵进程,使用流言协议(gossip protocol)来接收关于主节点是否下线的信息,并使用投票协议(voting protocol)来决定是否执行自动故障迁移,以及选择哪个备节点作为新的主节点。
如果一个主节点挂掉了,哨兵会向其它哨兵、主节点、备节点定时发送消息,以确认对方是否“活”着。如果发现对方在指定时间(可配置)内未回应,哨兵会暂时认为对方已挂。当多数哨兵都报告某一主节点没有响应时,系统才认为该主节点“彻底死亡”,通过算法从剩下的备节点中选一台提升为主节点,然后自动修改相关配置。
🍊 四、主备切换
当主备切换时可能会出现数据丢失的问题。主备切换的数据丢失问题包括异步复制导致的数据丢失和脑裂导致的数据丢失。
异步复制导致的数据丢失指的是在master->slave的复制过程中,如果主节点挂机时,有部分数据还没复制到slave,那么这部分数据就会丢失。而脑裂导致的数据丢失是指某个主节点所在的机器突然脱离了正常的网络,跟其他备节点不能连接,但是实际上主节点还在运行,此时哨兵可能会认为主节点宕机了,然后开启选举,将其他备节点切换成了主节点。这个时候,集群里就会有两个主节点,也就是所谓的脑裂。此时,虽然某个备节点被切换成了主节点,但是可能客户端还没来得及切换到新的主节点,还继续向旧主节点写数据。因此,旧主节点再次恢复的时候,会被作为一个备节点挂到新的主节点上,自己的数据会清空,重新从新的主节点复制数据。而新的主节点并没有后来客户端写入的数据,因此,这部分数据也就丢失了。
为了解决主备切换的数据丢失问题,可以进行配置。通过配置至少有1个备节点,数据复制和同步的延迟不能超过10秒,超过了主节点就不会再接收任何请求了。在脑裂场景下,最多就丢失10秒的数据。还可以减少异步复制数据的丢失,一旦备节点复制数据和ack延时太长,就认为可能主节点宕机后损失的数据太多了,那么就拒绝写请求,这样可以把主节点宕机时由于部分数据未同步到备节点导致的数据丢失降低到可控范围内。