Redis高可用之主从复制架构(第一部分)

本文涉及的产品
云原生内存数据库 Tair,内存型 2GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Redis 版,经济版 1GB 1个月
简介: Redis高可用之主从复制架构(第一部分)

引言

之前的文章 Redis持久化策略AOF、RDB详解及源码分析,我们介绍了Redis中的数据持久化技术,包括 RDB快照 和 AOF日志以及混合持久化 。有了持久化技术,我们就不用担心因Redis所在服务机器宕机,导致数据丢失。但是,持久化技术只是解决了Redis服务宕机后,数据的快速回复问题。并没有从根本上提高Redis的可用性。Redis提供的高可用主要分为:主从模式哨兵模式集群模式三种模式。这三种模式我会分为三部分介绍,今天我们就来聊一聊Redis的主从模式。

什么是高可用(分布式的概念)

假设,你的服务系统依赖于redis服务的数据。当Redis出现宕机时,就会导致你的服务系统不可用,这时就需要保证redis的高可用。简单来说就是:一个服务坏了,其他提供相同功能的服务可以顶替之前的服务继续对外提供服务,那么考虑,这些替补服务需要满足哪些条件呢?

  1. 数据同步,与当前提供服务的数据一致或者接近一致,这些服务就要进行数据同步;
  2. 如何切换,如何告诉对方,服务的提供者换成替补了?

高可用高的程度是由主从切换的时间决定的。通常要达到秒级別的切换。

同步复制和异步复制

  • 同步复制:客户端向主服务器修改数据库数据的命令,主服务器再执行完后,需要等待所有的从数据库都同步完成后才返回给客户端。优点:主从高度一致,数据可靠;缺点:每次都需要等待所有的从数据库完成同步,效率低。
  • 异步复制:客户端向主服务器修改数据库数据的命令,主服务器再执行完后立即返回给客户端。从服务器与主服务器建立连接,异步从主服务器同步数据。优点:服务的吞吐量高,响应速度快;缺点:数据可能不一致,redis采用的是异步复制

一、主从复制

Redis 提供的主从模式,是通过复制的方式,将主服务器上的Redis的数据同步复制一份到从 Redis 服务器,这种做法很常见,MySQL的主从也是这么做的。

主节点的Redis我们称之为master,从节点的Redis我们称之为slave,主从复制为单向复制,只能由主到从,不能由从到主。可以有多个从节点,比如1主3从甚至n从,从节点的个数需要根据实际的业务需求来确定。

1.3 主从数据一致性

为了保证主服务器Redis的数据和从服务器Redis的数据的一致性,也为了分担访问压力,均衡负载,应用层面一般采取读写分离的模式。

读操作:主、从库都可以执行,一般是在从库上读数据,对实时性和准确性有100%高真要求的部分业务,可以谨慎评估之后读主库;

写操作:只在主库上写数据,写完之后将写操作指令同步到从库。

二、主从复制搭建

主从复制的搭建完全是在从服务器上配置和发起的,主服务器不需要做任何事。在Redis5.0之前是slaveof < masterip > < masterport >。

2.1 配置文件的方式

在从服务器的 redis.conf 配置文件中加入:

replicaof <masterip> <masterport>
2.2 启动命令的方式

在 redis-server 命令后面加上–replicaof < masterip > < masterport >

比如:

redis-server --replicaof 127.0.0.1  6379
2.3 在服务器客户端通过命令的方式
replicaof <masterip> <masterport>

三、主从复制原理

1.1 复制功能实现

Redis复制功能分为同步命令传播两个部分:

  • 同步操作用于将从服务器的数据库状态更新至和主服务器当前一致的状态,这一步主要是同步主服务器发过来的RDB文件;
  • 命令传播操作用于将主服务器开启RDB文件同步后,执行的写命令传播给从服务器,从服务器再完成RDB文件同步后,继续执行这些写命令,从而达到与主服务器一致的状态。

Redis中从服务器对主服务的复制主要分为以下两种情况:

  1. 从服务器之前没有复制过任何主服务器,或者从服务器当前要复制的主服务器与之前复制的不是同一个主服务器。
  2. 断线后的重连:处于命令传播阶段的主从服务器主要因为网络原因而中断了复制,从服务器通过自动重连到主服务继续进行复制。
1.2 复制流程
  1. 客户端通过 redis-server --replicaof master:ip master:port 指定要复制的主服务器
  2. 从服务器与主服务器建立网络连接
  3. 从服务器向主服务器发送PSYNC 命令
  4. 主服务器收到PSYNC命令,执行BGSAVE命令,通过fork进程在子进程中生成RDB文件,并使用一个缓冲区专门记录从现在开始执行的写命令
  5. 当主服务器BGSAVE命令执行结束,主服务器会将该RDB文件发送给从服务器,从服务器接收并载入这个RDB文件,将自己的数据库状态更新至与主服务器执行BGSAVE命令时一致的状态
  6. 主服务器将记录在缓冲区的写命令发送给从服务器,从服务器执行这些命令达到与主数据库数据一致

PSYNC命令是一个非常耗费资源的操作:

  1. 对于主服务器来说,需要执行BGSAVE命令来生成RDB文件,这会耗费主服务大量的CPU、内存及磁盘IO资源
  2. 在BGSAVE命令完成后,还需要将RDB文件发送给从服务器,这会占用主从服务器大量的网络资源(带宽和流量),影响主服务器的命令响应时间
  3. 对于从服务来说,在载入RDB文件期间,会因为阻塞而无法处理命令请求

所以Redis要保证在需要的时候才执行PSYNC命令。

1.3 Redis复制策略

Redis 内部使用PSYNC命令来执行复制操作。PSYNC命令具有 全量数据同步增量数据同步 两种模式。全量数据复制很好理解,从服务器需要从头开始复制主服务器的数据;增量数据复制主要用在主从服务器因为网络问题导致的复制中断,在从服务器重新连接到主服务器进行的操作,此时,从服务器只需要执行在断开期间主服务器执行的写命令即可。

增量数据同步的实现,主要由三部分组成:

  1. 主服务器和从服务器的复制偏移量:主服务器和从服务器会分别维护一个复制偏移量。主服务器每次在向从服务器传播N个字节的数据,就将自己的偏移量加N;从服务器在收到主服务器N个字节的数据后,会给自己的偏移量加N。如果主从服务器的数据是一致的,那么主从服务器的偏移量总是相同的。相反,说明主从服务器数据不一致。

  2. 主服务的复制积压缓冲区
    主服务器维护了一个固定长度的队列,默认大小1MB。当主服务器执行命令传播是,不仅会将写命令发给所有的从服务器,还会将写命令写入到复制积压缓冲区中。缓冲区会为队列中的每个字节记录响应的复制偏移量。当从服务器重新连接上主服务器时,从服务器通过PSYNC命令将自己的偏移量offset发给主服务器,主服务器会根据这个偏移量决定执行何种同步操作:如果offset+1开始的数据仍然存在于缓冲区,则执行增量数据同步,否则执行全量数据同步。
    如果服务器需要执行大量的写命令,又或者主从断线后要经过很长的时间才能重新建立连接,那么就需要增大缓冲区的大小。可以根据以下公式来估算积压缓冲区的大小:buffer_size = 2* second * write_size_per_second,second是主从断线重连的平均时间,单位s,write_size_per_second是主服务器平均每秒产生的写命令(协议格式的写命令)的数据量。
  3. 服务器的运行ID
    每个Redis服务器,无论是主服务器还是从服务器,都有自己的运行ID。运行ID在服务器启动时自动生成,由40位随机的十六进制字符组成。当从服务器初次对主服务进行复制时,主服务器会将自己的运行ID发给从服务器,从服务器保存。当出现重连时,从服务器会将自己保存的运行ID发送给主服务器,主服务器拿到运行ID与自己的ID进行比较,如果相等并且offset+1的数据还在积压缓冲区中,则执行增量数据同步,否则执行全量数据同步。

四、PSYNC命令实现

replicaof 是异步命令,在从服务器完成“masterhost”和“masterport”的设置后,从服务向发送replicaof 的客户端回复OK,表示指令已经接收,而实际的复制是在返回OK后才开始执行:

  • 从服务器根据设置的主服务器的地址和端口,建立套接字连接,如果建立成功;
  • 向主服务器发送PING命令,检车网络状态和主服务器能否正常处理命令请求,如果主服务器返回PONG,继续执行,否则从服务器主动断开连接,重新建立套接字连接。
  • 是否需要身份认证,主要取决于主服务器的requirepass和从服务器的masterauth字段,如果需要验证,从服务会发送AUTH + masterauth。主服务器会将该值与自己的requirepass比较,相同则通过验证
  • 从服务器向主服务器发送自己监听的端口,让主服务器连接,通过这个连接同步数据;
  • 从服务器向主服务器发送PSYNC命令,开始执行同步操作。注意:在这一步后,主服务器也充当的是从服务器的客户端,因为只有成为从服务器的客户端,主服务器才能将缓冲区中的命令发送给从服务器执行。
  • 在完成了同步的操作后,主从服务器就会进入到命令传播阶段,这时主服务器只需一直将自己执行的写命令发送给从服务器,从服务器执行,就可以保证主从服务器数据一致。
心跳检测

在命令传播阶段,为了监测主从复制的情况,从服务器默认会以每秒一次的频率像主服务器发送命令(心跳检测):REPLCONF ACK  ,replication_offset是自己得复制偏移量。主要有三个作用:

(1)检测主从服务器的网络连接:如果主服务器超过1s,没有收到从服务器的REPLCONF ACK 命令,则主服务器就知道从服务器的连接出了问题,可以通过向主服务器发送 INFO replication命令,在列出的从服务器烂中,通过lag字段可以知道从服务器最后一次给主服务器发送REPLCONF ACK命令距离现在过去了多少秒。

(2)辅助实现min-slaves配置选项,redis.conf配置文件中min-slaves-to-write和min-slaves-max-lag两个选项可以防止主服务器在不安全的情况下执行写命令。简单来说就是,从服务器的数量不够了,或者每个从服务器的lag太大了,都会停止复制。

(3)检测命令丢失,如果因为网络问题导致主服务器发给从服务器的写命令丢失,主服务器通过replication_offset就知道命令丢了,去积压缓冲区找到重新发给从服务器。

五、主从模式的缺点

主从模型只解决了单点故障问题,没有主动通知机制,需要手动切换,仍然不是高可用,但是主从模型为高可用的实现已经打下了坚实的基础。后面两篇即将介绍的哨兵模式和集群模式实现了真正的高可用。


推荐一个零声学院免费教程,个人觉得老师讲得不错,分享给大家:[Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK等技术内容,点击立即学习:

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
2天前
|
存储 缓存 NoSQL
Redis常见面试题(二):redis分布式锁、redisson、主从一致性、Redlock红锁;Redis集群、主从复制,哨兵模式,分片集群;Redis为什么这么快,I/O多路复用模型
redis分布式锁、redisson、可重入、主从一致性、WatchDog、Redlock红锁、zookeeper;Redis集群、主从复制,全量同步、增量同步;哨兵,分片集群,Redis为什么这么快,I/O多路复用模型——用户空间和内核空间、阻塞IO、非阻塞IO、IO多路复用,Redis网络模型
Redis常见面试题(二):redis分布式锁、redisson、主从一致性、Redlock红锁;Redis集群、主从复制,哨兵模式,分片集群;Redis为什么这么快,I/O多路复用模型
|
1月前
|
缓存 NoSQL Redis
Redis主从架构
当看到图示中红色标记的,就代表从节点挂载成功了。
19 0
|
2天前
|
NoSQL Redis 开发工具
在多核 CPU 或 NUMA 架构的机器上运行 Redis 实例时应该注意什么
在多核 CPU 或 NUMA 架构的机器上运行 Redis 实例时应该注意什么
|
15天前
|
负载均衡 NoSQL 应用服务中间件
搭建高可用及负载均衡的Redis
【7月更文挑战第10天】
|
1月前
|
SQL 关系型数据库 MySQL
MySQL高可用架构设计:从主从复制到分布式集群
MySQL高可用性涉及主从复制、半同步复制和Group/InnoDB Cluster。主从复制通过二进制日志同步数据,保证故障时可切换。半同步复制确保事务在至少一个从服务器确认后才提交。Group Replication是多主复制,支持自动故障切换。InnoDB Cluster是8.0的集成解决方案,简化集群管理。使用这些技术能提升数据库的稳定性和可靠性。
223 2
|
1月前
|
监控 NoSQL Java
redis哨兵架构
不过为了高可用一般都推荐至少三个哨兵节点。为什么推荐奇数个哨兵节点跟集群奇数个master节点类似。
28 0
redis哨兵架构
|
1月前
|
存储 缓存 NoSQL
redis的集群架构
规避方法可以在redis配置里加上参数(这种方法不可能百分之百的避免数据丢失,参数集群leader选举机制)
22 0
|
3天前
|
缓存 监控 负载均衡
探索微服务架构中的API网关模式
在微服务架构的海洋中,API网关如同一座灯塔,指引着服务间的通信。本文将深入探讨API网关的设计哲学、关键功能以及在实际应用中的考量因素。通过对比分析,我们将揭示API网关如何在提高系统可维护性、增强安全性和优化性能方面发挥其不可或缺的作用。此外,文章还将提供实践指南,帮助读者在构建或改进微服务架构时,做出明智的API网关选择和部署决策。
|
3天前
|
Kubernetes 持续交付 开发者
探索后端技术的未来:微服务架构与容器化部署的融合
在数字化时代的浪潮中,后端技术正经历着前所未有的变革。本文将深入探讨微服务架构和容器化部署如何共同推动后端技术的发展,提升应用的性能、可扩展性和可靠性。通过分析现代软件开发的需求,我们将揭示这两种技术如何互补,以及它们在未来后端开发中的潜力和挑战。
|
2天前
|
存储 负载均衡 数据库
探索微服务架构中的服务发现机制
【7月更文挑战第24天】在微服务架构的复杂网络中,服务发现是确保通信流畅与系统弹性的关键组件。本文将深入探讨服务发现的工作原理、面临的挑战以及解决方案,同时比较不同服务发现工具的性能特点,旨在为开发者提供实现高效服务发现的实战指南。