Hadoop-31 ZooKeeper 内部原理 简述Leader选举 ZAB协议 一致性

本文涉及的产品
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: Hadoop-31 ZooKeeper 内部原理 简述Leader选举 ZAB协议 一致性

章节内容

上一节我们完成了:


新建Java的Maven工程

使用Java调用ZK 进行操作

创建节点、删除节点、监听节点等操作

背景介绍

这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。

之前已经在 VM 虚拟机上搭建过一次,但是没留下笔记,这次趁着前几天薅羊毛的3台机器,赶紧尝试在公网上搭建体验一下。


2C4G 编号 h121

2C4G 编号 h122

2C2G 编号 h123

Leader选举

选举机制

半数机制:集群中半数以上机器存活,集群可用。所以 ZooKeeper 适合奇数台。

ZooKeeper 虽然在配置文件中没有指定Master和Slave,但是ZK在工作的时候,会有一个Leader,其他的都是Follower。

首次启动

假设有五台集群的机器:

服务1启动,此时只有它一台启动了,它发出去的报文没有任何响应,所以一直是LOOKING状态。

服务2启动,它与最开始启动的服务1进行通信,互相交换自己的选举结果。由于两者都没有历史数据,所以ID值较大的服务2胜出。但是目前还没有超过半数的服务同意,所以服务1和服务2都是LOOKING状态。

服务3启动,服务3成了1、2、3的老大,集群中>=2台选了3,所以服务3成了Leader。

服务4启动,服务4应该是1、2、3的老大,但是集群已经选了3为老大,所以4只可以做Follower。

服务5启动,同4。

非首次启动

每次选举的时候都会根据自身的事务ID,优先选择事务ID大的为 Leader。


ZAB 一致性

ZAB 介绍

ZAB 是 Apache ZooKeeper 的一种使用场景和实现模式。

ZK就是分布式一致性问题的工业解决方案,Paxos算法是底层算法。

ZAB,即 ZooKeeper Atomic Broadcast,是 ZooKeeper 背后的一致性算法,确保了分布式系统中的数据一致性和可靠性。


数据一致性

为什么会出现数据一致性问题?


将数据复制到分布式部署的多台机器中,可以消除单点故障,防止由于部分服务器宕机导致服务不可用。

通过负载均衡,能够让分布在不同地区的数据副本全都对外提供服务,提高系统性能。

但是分布式后,会导致数据不一致的情况出现

比如常见于 主从复制的时候:

主备模式

ZK中,所有客户端写入数据都是写入Leader,由Leader复制到Follower中。

广播消息

ZAB协议的消息广播过程类似于二阶段提交。

对于客户端的写请求,全部由 Leader 接收,Leader将请求封装成一个事务 Proposal(提议),将其发送给所有Follower。

如果收到超过半数反馈ACK,则执行Commit操作(先提交自己,再发送Commit给其他Follower)。


发送Proposal到Follower

Leader接收Follower的ACK

超过半数ACK则进行Commit

Leader宕机

Leader如果宕机了,ZK集群将无法正常工作,ZAB协议提供了一个高效可靠的Leader选举算法。

  • ZAB协议保证那些已经在Leader提交的事务最终会被所有服务器提交
  • ZAB协议保证丢弃那些只在Leader 提交/复制,但没有提交的事务。
相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
目录
相关文章
|
20天前
|
分布式计算 NoSQL Java
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
37 2
|
20天前
|
分布式计算 Java Hadoop
Hadoop-30 ZooKeeper集群 JavaAPI 客户端 POM Java操作ZK 监听节点 监听数据变化 创建节点 删除节点
Hadoop-30 ZooKeeper集群 JavaAPI 客户端 POM Java操作ZK 监听节点 监听数据变化 创建节点 删除节点
48 1
|
20天前
|
分布式计算 监控 Hadoop
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
34 1
|
20天前
|
分布式计算 Hadoop Unix
Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制
Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制
37 1
|
19天前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
98 6
|
19天前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
48 2
|
15天前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
30 1
|
21天前
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
63 5
|
21天前
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
30 4
|
21天前
|
大数据 网络安全 数据安全/隐私保护
大数据-03-Hadoop集群 免密登录 超详细 3节点云 分发脚本 踩坑笔记 SSH免密 集群搭建(二)
大数据-03-Hadoop集群 免密登录 超详细 3节点云 分发脚本 踩坑笔记 SSH免密 集群搭建(二)
79 5