概述
哨兵本质就是一个Redis实例节点。哨兵模式是一种特殊的模式,它能够后台监控主机是否故障,如果故障了,则根据投票数自动将Slave节点转换为新的Master节点。首先Redis提供了哨兵的命令,哨兵是一个独立的进程,会独立的运行。它的原理是:哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
哨兵配置文件sentinel.conf
#sentinel端口号
port 26380
#监视ip:port的主节点,且至少有num个Sentinel判断主节点失效,才进行自动故障迁移
sentinel monitor mymaster ip port num
#指定Sentinel认为服务器已经断线所需要的毫秒数,如果服务器在给定的毫秒数内,没有返回Sentinel发送的PING命令的回复,或者返回一个错误的,那么Sentinel将这个服务器标记为主观下线
sentinel down-after-milliseconds mymaster 60000
#故障迁移超时时间
sentinel failover-timeout mymaster 180000
#指定了在执行故障转移时,最多可以有多少个从服务器同时对新的主服务器进行同步,这个数字越小,完成故障转移所需要的时间就越长。
sentinel parallel-syncs mymaster 1
哨兵监测集群状态方法
每个Sentinel每隔2秒会向指定频道发布自己对Master节点是否正常的判断以及当前Sentinel节点的信息,并通过订阅这个频道,可以获得其他Sentinel节点的信息和对Master节点是否存活的判断。
每个Sentinel每隔1秒会向所有节点(Sentinel节点、Master节点、Slave节点)发送PING指令来进行心跳检测。
选举流程
当一个Sentinel判断主节点不可用的时候,会首先进行“主观下线”,此时,这个Sentinel通过sentinel is-masterdown-by-addr指令获取其他哨兵节点对主节点的判断,如果当前哨兵节点对主节点主观下线的票数超过了我们定义的quorum值,则主节点被判定为“客观下线”。
Leader Sentinel节点会从原主节点的从节点中选出一个新的主节点,选举流程如下:
1.首先,过滤掉所有主观下线的节点;
2.然后,选择slave-priority最高的节点,如果有则返回,没有则继续;
3.选择出复制偏移量offset最大的节点,如果有则返回,没有则继续;
4.选择出run_id最小的节点,其中,run_id表示服务器运行ID;
5.在选择完毕后,Leader Sentinel节点会通过SLAVEOF NO ONE命令让选择出来的从节点成为主节点,然后通过Slaveof命令,让其他的节点成为该节点的从节点。