ZooKeeper详解

2024-05-06 766

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ZooKeeper是大数据组件中的协调器，确保高可用性和一致性。它用于监控主备节点切换（如Hadoop YARN的ResourceManager，HBase的RegionServer，Spark的Master）并实现数据同步。设计基于文件系统和通知机制，通过Znodes的状态变化（创建、删除、更新、子节点变化）进行协调。ZooKeeper使用观察者模式，当Znode变化时，通知客户端。其数据结构为树形，提供CLI工具如`zkCli.sh`进行交互。ZooKeeper有三个默认端口：2181（客户端连接），2888（服务器间同步），3888（选举）。选举采用半数机制，确保集群稳定性。

@[TOC]

ZooKeeper

作用

ZooKeeper在大数据组件中起着重要的==协调作用==，帮助实现==高可用性和一致性==。
通常用于监控主备节点，实现高可用；也用于同步数据。
举例
1.在Hadoop YARN中，实现了ResourceManager的HA。当主ResourceManager节点故障时，ZooKeeper会帮助切换到备用的ResourceManager节点。
2.在HBase中，实现了RegionServer的HA。当一个HBase RegionServer节点失效时，ZooKeeper帮助重新分配这个节点的负载给其他可用的节点。
3.在Spark中，实现了Master的HA。如果当前的Master节点失效，ZooKeeper会通知备用Master节点接管。

设计原理

文件系统(存储和管理数据)+通知机制(当观察者观察的Znode[Zookeeper DataNode]的数据状态发生变化之后，ZooKeeper通知在Zookeeper上注册的观察者(客户端)做出相应的反应)
观察者模式
- 当被观察者状态发生改变时，它会通知所有的观察者对象，使他们能够及时做出响应。

Znodes的状态变化

创建Znode：服务器启动时去ZooKeeper注册信息
删除Znode：服务器下线时去ZooKeeper注销信息
更新Znode数据：服务的配置信息发生变化，去更新ZooKeeper中相关的Znode的数据。
子节点变化：如果一个Znode有子节点，这些子节点的添加或删除也会被视为父ZNode的状态变化。

具体步骤ZooKeeper原理

注册观察
- 服务器启动时在ZooKeeper集群中通过创建或更新Znodes来完成注册信息
- 客户端获取当前服务器列表，并注册监听。
事件触发
- 如果服务器发生事件，在集群中的Znodes发生相应的状态变化(如数据更新、节点删除、子节点变化)。ZooKeeper集群将检测到这些变化。
通知观察者
- ZooKeeper会向所有对该znode注册了观察的客户端发送通知。这些通知是一次性的，也就是说，一旦发送了通知，相应的观察就被移除了。
- 如果客户端需要继续监视该znode的后续变化，它必须再次注册观察。
客户端响应
- 收到通知后，客户端进行操作(如读取更新后的数据，调整其内部状态)。

ZooKeeper数据结构(了解)

树结构
- ZooKeeper
  - config 存储集群的动态配置
  - quota 实现节点的配额管理

ZooKeeper CLI

zkCli.sh：进入ZooKeeper
ls path：查看路径对应znode下的所有子节点
get path：获取节点的值

ZooKeeper 端口号

客户端连接端口(Client Port):默认为==2181==，用于客户端与zookeeper服务器进行通信。
服务器之间通信端口(Peer Port))：默认为==2888==，用于zookeeper服务器之间进行数据同步和选举。
选举通信端口(Leader Election Port))：默认为==3888==，用于zookeeper服务器之间进行选举。
Zookeeper角色

ZooKeeper选举机制

半数机制

集群中半数以上机器存活，集群可用
ZooKeeper工作时，有一个节点为Leader，其他为Follower，Leader是通过内部选举机制临时产生的
Leader选举是保证分布式数据一致性的关键所在
1. 单一写入点。
2. 更新状态，确保数据全局一致性。
3. Leader失联时进行新的Leader选举。

leader选举触发时机

服务器初始化启动(没有Leader)
服务器运行期间无法和Leader保持连接(Leader故障)

补充

通常ZooKeeper的机器数是奇数。
后加的机器一定不会是Leader。
每一次进行状态更新，zxid递增，对于具有相同zxid的机器，myid越大的机器会成为Leader。

结尾图片.png

ZooKeeper详解

ZooKeeper

作用

举例

设计原理

Znodes的状态变化

具体步骤ZooKeeper原理

ZooKeeper数据结构(了解)

ZooKeeper CLI

ZooKeeper 端口号

Zookeeper角色

ZooKeeper选举机制

半数机制

leader选举触发时机

补充

大数据与机器学习

热门文章

最新文章

相关电子书