ZK源码阅读系列-ZK集群Leader选举解析

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
注册配置 MSE Nacos/ZooKeeper,182元/月
简介: ZK服务端启动代码涉及很广,本文就集群下的zookeeper是怎么选举leader的进析。

微信截图_20220531120138.png

ZK服务端启动代码涉及很广,本文就集群下的zookeeper是怎么选举leader的进析。

当然我们要先知道什么是ZAB协议,所谓的ZAB协议也就是原子消息广播协议,也是zookeeper作为其数据一致性的核心算法,基于协议,Zookeeper实现了一种主备模式的系统架构来保持集群中各副本之间的数据一致性。具体的是Zookeeper集群中只会有一个进程(Leader)来处理客户端的所有事务请求,并将Leader的事务变更记录广播到所有的副本上去。
ZAB基本模式可分为消息广播和崩溃恢复,进一步又可以分为三个阶段
1.发现(Discovery):其实就是Leader选举的过程
2.同步(Synchronization):选举Leader结束之后,Leader要将自己的事务数据同步到其他副本
3.Broadcast(广播阶段):数据同步结束后Leader接收客户端的事务请求,并且将事务请求广播给所有的副本
一.服务器的状态
/**
*状态enum解读
*LOOKING:选举态,服务器这种状态时,会发起投票选举Leader
*FOLLOWING: 跟随者状态,也就是Leader的副本
*LEADING: 领导者状态,Leader,ZAB协议中只允许存在一个Leader
*OBSERVING:观察者状态
*/
public enum ServerState {
   LOOKING, FOLLOWING, LEADING, OBSERVING;
}
复制代码
二.选举方式

Zookeeper提供了三种选举方式,但是在3.4.0版本后只提供一种即FastLeaderElection,类图如下微信截图_20220531120035.pngaaaa主要内部类Notification的代码

public static  class Notification {
    //版本号
    int version;
    //建议的leader sid
    long leader;
    //被推举的leader的事务Id
    long zxid;
    //选举时钟
    long electionEpoch;
    //被推举leader的状态
    QuorumPeer.ServerState state;
    //发送次条数据的sid
    long sid;
    //被推举leader的时钟
    long peerEpoch;
}
复制代码

微信截图_20220531115959.png

主要Messenger类,由类图可以看到Messenger主要包装了WorkerSender和WorkerReceiver,WorkerReceiver选票接收线程直接看run方法这个类做了什么微信截图_20220531115927.png

结合流程图梳理下大致过程

1.线程循环从QuorumCnxManager.recvQueue()获取mesage,判断message中的机器是否是观察者,是的话就发送当前服务器的投票
2.非观察者的话解析message封装为Notification,判断当前服务器是否是Looking状态
3.是Looking状态将Notification加入recvqueue中,并且判断投票的服务器是否是Looking并且选举的轮次小于当前服务器的轮次,发送当前机器的投票否则不作处理
4.是Looking状态将Notification加入recvqueue中,并且判断投票的服务器是否是Looking并且选举的轮次小于当前服务器的轮次,发送当前机器的投票否则不作处理
5.非Looking状态,判断发送方是否是Looking状态,是的话就发送自己的选票(此时选票一定是leader),否的话就不做处理
三.WorkerSender选票发送线程
class WorkerSender extends ZooKeeperThread {
    volatile boolean stop;
    QuorumCnxManager manager;
    WorkerSender(QuorumCnxManager manager){
        super("WorkerSender");
        this.stop = false;
        this.manager = manager;
    }
    public void run() {
        while (!stop) {
            try {
            //从队列取数据
                ToSend m = sendqueue.poll(3000, TimeUnit.MILLISECONDS); 
                if(m == null) continue;
                //处理数据
                process(m);
            } catch (InterruptedException e) {
                break;
            }
        }
        LOG.info("WorkerSender is down");
    }
    void process(ToSend m) {
        ByteBuffer requestBuffer = buildMsg(m.state.ordinal(),
                m.leader,
                m.zxid,
                m.electionEpoch,
                m.peerEpoch);
        manager.toSend(m.sid, requestBuffer);
    }
}
复制代码
四.选举的流程图看,如图:

微信截图_20220531115755.png

选举过程解读:
1.Zookeeper服务端第一次启动时候,会像所有连接的Server发送选择自己为leader的选票
2.判断server是否处于Looking选举状态,是进入循环
3.recvqueue.poll()规定时间内接收不到投票的话,就发送自己的投票,接收到了投票进入@4
4.判断发送票子的服务器的状态,判断是否Looking选举状态,是进入@5否则@9
5.判断票子的轮次(epoch)是否大于当前服务器的逻辑轮次是进入@6否进入@7
6.是的话,说明当前的轮次已经落后其他服务的轮次,重新设置轮次保持选举周期一致,并且清空自己收到的票子集合(recvset),接着比较收到的投票和自己服务器的投票,然后发送俩者获胜的票子
7.否的话,比较收到的投票和自己的投票,收到的投票获胜的话,更新到自己的投票并且发送至其他服务器
8.归档投票集合(recvset),判断自己选票是否过半,过半的话,继续判断是否接收到由于自己的投票,如果没有的话就确定最终选票,选出Leader
9.如果选票的中的服务器是Follower或者Leader时,判断选票中的轮次和自己内部的逻辑时钟是否相同l,是进入@10否进入@11
10.是的话,归档投票(recvset),并且验证是否可以加入集群,验证结束可以加入的话,设置自己的状态,完成投票
11.否的话,记录到outofelection,这个集合记录的是非选举状态发送的投票集合,归档outofelection,过半验证后选出Leader,更内部服务器状态完成选票,到这里选票过程已经结束代码结合上下文的话其实很复杂,需要耐心看


源码研究得坚持不懈,有足够的耐心,文章中都是挑重要的类和主要流程进行概括,可能有理解不到位的地方,有问题的话请指出,我们共同探讨,一起进步。


目录
相关文章
|
11月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
269 2
|
7月前
|
算法 测试技术 C语言
深入理解HTTP/2:nghttp2库源码解析及客户端实现示例
通过解析nghttp2库的源码和实现一个简单的HTTP/2客户端示例,本文详细介绍了HTTP/2的关键特性和nghttp2的核心实现。了解这些内容可以帮助开发者更好地理解HTTP/2协议,提高Web应用的性能和用户体验。对于实际开发中的应用,可以根据需要进一步优化和扩展代码,以满足具体需求。
654 29
|
7月前
|
前端开发 数据安全/隐私保护 CDN
二次元聚合短视频解析去水印系统源码
二次元聚合短视频解析去水印系统源码
187 4
|
7月前
|
JavaScript 算法 前端开发
JS数组操作方法全景图,全网最全构建完整知识网络!js数组操作方法全集(实现筛选转换、随机排序洗牌算法、复杂数据处理统计等情景详解,附大量源码和易错点解析)
这些方法提供了对数组的全面操作,包括搜索、遍历、转换和聚合等。通过分为原地操作方法、非原地操作方法和其他方法便于您理解和记忆,并熟悉他们各自的使用方法与使用范围。详细的案例与进阶使用,方便您理解数组操作的底层原理。链式调用的几个案例,让您玩转数组操作。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
|
7月前
|
移动开发 前端开发 JavaScript
从入门到精通:H5游戏源码开发技术全解析与未来趋势洞察
H5游戏凭借其跨平台、易传播和开发成本低的优势,近年来发展迅猛。接下来,让我们深入了解 H5 游戏源码开发的技术教程以及未来的发展趋势。
|
7月前
|
存储 前端开发 JavaScript
在线教育网课系统源码开发指南:功能设计与技术实现深度解析
在线教育网课系统是近年来发展迅猛的教育形式的核心载体,具备用户管理、课程管理、教学互动、学习评估等功能。本文从功能和技术两方面解析其源码开发,涵盖前端(HTML5、CSS3、JavaScript等)、后端(Java、Python等)、流媒体及云计算技术,并强调安全性、稳定性和用户体验的重要性。
|
7月前
|
负载均衡 JavaScript 前端开发
分片上传技术全解析:原理、优势与应用(含简单实现源码)
分片上传通过将大文件分割成多个小的片段或块,然后并行或顺序地上传这些片段,从而提高上传效率和可靠性,特别适用于大文件的上传场景,尤其是在网络环境不佳时,分片上传能有效提高上传体验。 博客不应该只有代码和解决方案,重点应该在于给出解决方案的同时分享思维模式,只有思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
|
10月前
|
存储 SpringCloudAlibaba Java
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论。
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
|
10月前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
创建型模式的主要关注点是“怎样创建对象?”,它的主要特点是"将对象的创建与使用分离”。这样可以降低系统的耦合度,使用者不需要关注对象的创建细节。创建型模式分为5种:单例模式、工厂方法模式抽象工厂式、原型模式、建造者模式。
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
|
10月前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析

推荐镜像

更多
  • DNS