ZK源码阅读系列-ZK集群Leader选举解析

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
云原生网关 MSE Higress,422元/月
简介: ZK服务端启动代码涉及很广,本文就集群下的zookeeper是怎么选举leader的进析。

微信截图_20220531120138.png

ZK服务端启动代码涉及很广,本文就集群下的zookeeper是怎么选举leader的进析。

当然我们要先知道什么是ZAB协议,所谓的ZAB协议也就是原子消息广播协议,也是zookeeper作为其数据一致性的核心算法,基于协议,Zookeeper实现了一种主备模式的系统架构来保持集群中各副本之间的数据一致性。具体的是Zookeeper集群中只会有一个进程(Leader)来处理客户端的所有事务请求,并将Leader的事务变更记录广播到所有的副本上去。
ZAB基本模式可分为消息广播和崩溃恢复,进一步又可以分为三个阶段
1.发现(Discovery):其实就是Leader选举的过程
2.同步(Synchronization):选举Leader结束之后,Leader要将自己的事务数据同步到其他副本
3.Broadcast(广播阶段):数据同步结束后Leader接收客户端的事务请求,并且将事务请求广播给所有的副本
一.服务器的状态
/**
*状态enum解读
*LOOKING:选举态,服务器这种状态时,会发起投票选举Leader
*FOLLOWING: 跟随者状态,也就是Leader的副本
*LEADING: 领导者状态,Leader,ZAB协议中只允许存在一个Leader
*OBSERVING:观察者状态
*/
public enum ServerState {
   LOOKING, FOLLOWING, LEADING, OBSERVING;
}
复制代码
二.选举方式

Zookeeper提供了三种选举方式,但是在3.4.0版本后只提供一种即FastLeaderElection,类图如下微信截图_20220531120035.pngaaaa主要内部类Notification的代码

public static  class Notification {
    //版本号
    int version;
    //建议的leader sid
    long leader;
    //被推举的leader的事务Id
    long zxid;
    //选举时钟
    long electionEpoch;
    //被推举leader的状态
    QuorumPeer.ServerState state;
    //发送次条数据的sid
    long sid;
    //被推举leader的时钟
    long peerEpoch;
}
复制代码

微信截图_20220531115959.png

主要Messenger类,由类图可以看到Messenger主要包装了WorkerSender和WorkerReceiver,WorkerReceiver选票接收线程直接看run方法这个类做了什么微信截图_20220531115927.png

结合流程图梳理下大致过程

1.线程循环从QuorumCnxManager.recvQueue()获取mesage,判断message中的机器是否是观察者,是的话就发送当前服务器的投票
2.非观察者的话解析message封装为Notification,判断当前服务器是否是Looking状态
3.是Looking状态将Notification加入recvqueue中,并且判断投票的服务器是否是Looking并且选举的轮次小于当前服务器的轮次,发送当前机器的投票否则不作处理
4.是Looking状态将Notification加入recvqueue中,并且判断投票的服务器是否是Looking并且选举的轮次小于当前服务器的轮次,发送当前机器的投票否则不作处理
5.非Looking状态,判断发送方是否是Looking状态,是的话就发送自己的选票(此时选票一定是leader),否的话就不做处理
三.WorkerSender选票发送线程
class WorkerSender extends ZooKeeperThread {
    volatile boolean stop;
    QuorumCnxManager manager;
    WorkerSender(QuorumCnxManager manager){
        super("WorkerSender");
        this.stop = false;
        this.manager = manager;
    }
    public void run() {
        while (!stop) {
            try {
            //从队列取数据
                ToSend m = sendqueue.poll(3000, TimeUnit.MILLISECONDS); 
                if(m == null) continue;
                //处理数据
                process(m);
            } catch (InterruptedException e) {
                break;
            }
        }
        LOG.info("WorkerSender is down");
    }
    void process(ToSend m) {
        ByteBuffer requestBuffer = buildMsg(m.state.ordinal(),
                m.leader,
                m.zxid,
                m.electionEpoch,
                m.peerEpoch);
        manager.toSend(m.sid, requestBuffer);
    }
}
复制代码
四.选举的流程图看,如图:

微信截图_20220531115755.png

选举过程解读:
1.Zookeeper服务端第一次启动时候,会像所有连接的Server发送选择自己为leader的选票
2.判断server是否处于Looking选举状态,是进入循环
3.recvqueue.poll()规定时间内接收不到投票的话,就发送自己的投票,接收到了投票进入@4
4.判断发送票子的服务器的状态,判断是否Looking选举状态,是进入@5否则@9
5.判断票子的轮次(epoch)是否大于当前服务器的逻辑轮次是进入@6否进入@7
6.是的话,说明当前的轮次已经落后其他服务的轮次,重新设置轮次保持选举周期一致,并且清空自己收到的票子集合(recvset),接着比较收到的投票和自己服务器的投票,然后发送俩者获胜的票子
7.否的话,比较收到的投票和自己的投票,收到的投票获胜的话,更新到自己的投票并且发送至其他服务器
8.归档投票集合(recvset),判断自己选票是否过半,过半的话,继续判断是否接收到由于自己的投票,如果没有的话就确定最终选票,选出Leader
9.如果选票的中的服务器是Follower或者Leader时,判断选票中的轮次和自己内部的逻辑时钟是否相同l,是进入@10否进入@11
10.是的话,归档投票(recvset),并且验证是否可以加入集群,验证结束可以加入的话,设置自己的状态,完成投票
11.否的话,记录到outofelection,这个集合记录的是非选举状态发送的投票集合,归档outofelection,过半验证后选出Leader,更内部服务器状态完成选票,到这里选票过程已经结束代码结合上下文的话其实很复杂,需要耐心看


源码研究得坚持不懈,有足够的耐心,文章中都是挑重要的类和主要流程进行概括,可能有理解不到位的地方,有问题的话请指出,我们共同探讨,一起进步。


目录
相关文章
|
3月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
133 2
|
4月前
|
缓存 Java 程序员
Map - LinkedHashSet&Map源码解析
Map - LinkedHashSet&Map源码解析
100 1
|
4月前
|
算法 Java 容器
Map - HashSet & HashMap 源码解析
Map - HashSet & HashMap 源码解析
86 0
|
2月前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
创建型模式的主要关注点是“怎样创建对象?”,它的主要特点是"将对象的创建与使用分离”。这样可以降低系统的耦合度,使用者不需要关注对象的创建细节。创建型模式分为5种:单例模式、工厂方法模式抽象工厂式、原型模式、建造者模式。
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
|
2月前
|
存储 SpringCloudAlibaba Java
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论。
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
|
2月前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
|
2月前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式,前者采用继承机制来组织接口和类,后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象结构型模式比类结构型模式具有更大的灵活性。 结构型模式分为以下 7 种: • 代理模式 • 适配器模式 • 装饰者模式 • 桥接模式 • 外观模式 • 组合模式 • 享元模式
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
|
1月前
|
自然语言处理 数据处理 索引
mindspeed-llm源码解析(一)preprocess_data
mindspeed-llm是昇腾模型套件代码仓,原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py(基于1.0.0分支),数据处理是模型训练的第一步,经常会用到。
52 0
|
3月前
|
缓存 监控 Java
Java线程池提交任务流程底层源码与源码解析
【11月更文挑战第30天】嘿,各位技术爱好者们,今天咱们来聊聊Java线程池提交任务的底层源码与源码解析。作为一个资深的Java开发者,我相信你一定对线程池并不陌生。线程池作为并发编程中的一大利器,其重要性不言而喻。今天,我将以对话的方式,带你一步步深入线程池的奥秘,从概述到功能点,再到背景和业务点,最后到底层原理和示例,让你对线程池有一个全新的认识。
76 12
|
2月前
|
PyTorch Shell API
Ascend Extension for PyTorch的源码解析
本文介绍了Ascend对PyTorch代码的适配过程,包括源码下载、编译步骤及常见问题,详细解析了torch-npu编译后的文件结构和三种实现昇腾NPU算子调用的方式:通过torch的register方式、定义算子方式和API重定向映射方式。这对于开发者理解和使用Ascend平台上的PyTorch具有重要指导意义。

热门文章

最新文章

推荐镜像

更多