大家好,我是南哥。
一个对Java程序员进阶成长颇有研究的人,今天继续给大家带来新的一篇Java进阶指南。
如果是单机版的数据库,像MySQL、Redis,看起来实现并不复杂。只要支持保存一条数据,同时要能够查询出来。但如果是多机版的数据库呢,各个节点的配合联调是比较复杂的过程,看起来就不是那么简单喽。要考你对Redis深不深入理解,问问Redis多机版相关的问题就知道了。
我们今天就来指南下Redis主从架构。
1. Redis数据同步
1.1 数据同步过程
面试官:我看你们项目用的Redis主从,数据同步了解吗?
回答数据同步过程问题前,大家有没想过为什么Redis要数据同步?不会是MySQL主从架构要数据同步,Redis就照猫画虎吧。
虽然这两者有关系型数据库和非关系型数据库的差异,但都是作为存储数据的数据库系统。而主从架构的目的就在于对数据有多个"备份",有了多个"备份",就自然而然衍生出众多好处。如负载均衡、灾难恢复、数据备份。
既然要"备份",那数据同步就必不可少了。Redis主从数据同步大致的过程如下。
- 首先,从服务器会先向主服务器发送SYNC命令。
- 收到命令后,Redis主服务器会执行BGSAVE命令来生成一个RDB文件,并使用AOF缓冲区来记录在生成期间执行的写命令。关于BGSAVE命令和SAVE命令的区别,大家可以往前阅读我写的Redis系列文章。
- 完成第二步后,主服务器会将RDB文件发送给从服务器,让从服务器同步RDB文件数据。
- 当然这还没完,在生成RDB文件的过程中,仍然会有其他写命令到达服务器。Redis主服务器的AOF缓冲区会继续发送给从服务器,让它们之间的数据同步至最终状态。
1.2 命令传播
面试官:按你这么说,数据同步后主服务器某个键删除了,数据又不同步了怎么办?
有了AOF缓冲区的概念还没完,Redis主从复制还有一个命令传播的概念等着你去学。
从服务器使用SYNC进行初次数据同步后,主、从服务器的数据库状态并不是每时每刻都保持一致的,这种情况反而是常态。肯定不能为了一条写指令的差异就重新执行SYNC命令,因为SYNC命令是一个非常耗费资源的操作。
这种情况Redis主服务器会将造成主从服务器数据不一致的写命令,即最近执行的写命令,发送给从服务器执行。这便是命令传播的过程,当从服务器执行命令后,主从服务器的数据库状态也就保持了一致。
如果后续有新的命令写入主服务器,主服务器会继续重复命令传播的过程。
1.3 部分重同步
面试官:如果主从服务器断线呢?还是用的RDB来同步吗?
主从服务器断线的话,假设你是Redis开发者,要怎么高效地恢复主、从服务器数据同步的状态。
如果还是用的RDB文件来同步,也太浪费资源了。有可能只是短时间断线,执行的写命令不过几十个,上文我已经提到SYNC命令是很耗费资源的一种操作。
能不能有一支记号笔,在主、从服务器断线时在主服务器的命令队列画下一个记号?
其实Redis除了提供SYNC命令的支持,还有一个叫PSYNC命令。
主从服务器断线后,Redis从服务器会发送一个PSYNC命令给主服务器。收到命令后主服务器会将两者断线期间执行的写命令一条不剩地发送给从服务器。
从服务器执行命令后,主、从服务器的数据也就同步了。这种同步方式也叫部分重同步。
1.4 复制偏移量
面试官:那主服务器怎么知道断线期间执行了哪些命令?
提前剧透下,前面提到的记号笔就是复制偏移量,命令队列也就是复制积压缓冲区队列。
Redis主、从服务器都会去维护一个复制偏移量,复制偏移量是什么?例如主从服务器的初始偏移量都是0,主服务器发送给从服务器N字节数据后,主从服务器的偏移量就会 + N。复制偏移量通过该数值来代表主服务器发送给从服务器的字节总量。
通过复制偏移量就可以来记录同步状态。
Redis其实有是一个容器来存储命令传播的写命令,命令传播的命令保存在一个有复制偏移量标识的复制积压缓冲区队列。
从服务器发送PSYNC命令给主服务器,还会同时发送从服务器的复制偏移量。主服务器只要根据该复制偏移量在复制积压缓冲区队列中找到对应的命令,就可以发送相关命令给到从服务器。
2. 服务器运行ID
面试官:知道服务器运行ID吗?
每个Redis节点都有自己的服务器运行ID,这个ID由服务器启动时自动生成。
当从服务器对主服务器进行初次复制时,主服务器会将自己的运行ID传送给从服务器,而从服务器则会将这个运行ID保存起来。
当断线后数据同步时,从服务器会向当前连接的主服务器发送之前保存的主服务器运行ID。
如果此时主服务器发现从服务器发送的运行ID与自己的不一致。那就说明此时的主服务器是新的主服务器,它也没有复制积压缓冲区队列,也就不能进行部分重同步。此时Redis主服务器会向从服务器发送RDB文件来进行数据同步。
3. Redis心跳检测
面试官:Redis心跳检测知道吧?
从服务器默认会每秒一次向主服务器发送心跳检测命令,如果主服务器超过1s没有收到replconf命令,说明主从服务器的网络连接有问题了。
以下是心跳检测命令。
REPLCONF ACK <replication_offset>
同时这个心跳检测命令还会附带传送一个复制偏移量,也就是上文的replication_offset
。
在心跳检测时的过程中,如果主服务器发现他们的复制偏移量不一致,就会通过该偏移量找到从服务器丢失的写命令,从而发送给从服务器保持同步。
到这我们就知道了,心跳检测不仅仅能让主服务器检测从服务器是否存活。Redis开发者很聪明,在从服务器发送心跳检测命令时添加复制偏移量,让心跳检测也具有检测命令丢失的功能。
本文收录在我开源的《Java学习面试指南》中,目前已经更新有近200道面试官常考的面试题,涵盖了Java系列、Redis系列、MySQL系列、多线程系列、Kafka系列、JVM系列、ZooKeeper系列等等。GitHub地址:https://github.com/hdgaadd/JavaGetOffer,相信你看了一定会有所收获。
创作不易,不妨点赞、收藏、关注支持一下,各位的支持就是我创作的最大动力❤️