万能的zookeeper,分布式环境的动物管理员

简介: 万能的zookeeper,分布式环境的动物管理员

这是我的第43篇原创


今天跟你聊聊分布式环境的老中医ZooKeeper,专治各种不服。在大数据环境中,这个zookeeper是一个非常独特的存在,很多组件高度依赖ZK,一旦脱离了ZK就无法运行了,比如Kafka、Hbase等。Hadoop生态圈里有很多的动物,什么大象、蜂象、松鼠啥的。ZooKeeper的就像是他的名字一样,是Hadoop体系这个动物园里的管理员,专门负责让这些动物乖乖听话的。


Hadoop生态圈

图是网上找的,好像是个韩国人画的,右下角有版权,但是已经看不清了。

Hadoop是只大象,hive是大象+蜜蜂,Flink是是松鼠,Chukwa是只乌龟,pig是只猪,TEZ是个大象脑袋,TAJO是一只鸵鸟。整个Hadoop体系就像是一个动物园一样,管理着整个动物园。

之前有聊过,所有的分布式场景都会涉及到一致性的问题。于是apache基金会成立了一个项目,把一致性的能力抽象出来,这就有了分布式一致性协调器--ZooKeeper。


ZooKeeper原子广播协议

早期的分布式应用都各自实现了一致性的功能。在ZooKeeper出现之后,很多应用直接把一致性的事情交给ZooKeeper了,比如kafka、HBASE等。前面分享过分布式一致性协议的鼻祖-paxos。但是ZooKeeper用的是ZAB(ZooKeeper Atomic Broadcast),也就是Zookeeper原子消息广播协议。

ZAB的逻辑大致如上图所示。与Paxos去中心化不同,ZAB选择了使用一个全局唯一的Leader来做决定。

  • Leader把客户端的事务请求转化为一个事务Proposal即提案/提议,并将Proposal提案发给集群里所有的Follower节点服务器。
  • 所有Follower收到Proposal提案之后,会给一个ack反馈。
  • 当Leader收到了一半以上的节点的正确反馈后,Leader就会直接下发Commit指令给所有节点。
  • 所有Follower收到Commit指令之后就会递交之前收到的Proposal提案。

这个逻辑是不是很像2PC啊?对,这就是一个简化版的2PC。


但是这个结构有一个致命的问题:Leader是单点的,单点永远最危险。万一Leader挂了怎么办?没事,ZAB有一个崩溃恢复模式,专门应对这种情况,简单来说就是一旦集群里的Leader崩溃了,集群会立刻开始投票,选举一个Leader,然后大家继续进行上面的流程。

ZAB选举流程:

每个服务器都有一个zxid,同时有自己的myid,ZAB就是通过这两个id进行选举的。基本上会通过两个步骤完成选举:

  • 首次投票:每个服务器将自己的MyID和ZXID传给集群中其他所有的节点;
  • 二次投票:每个节点收到所有节点的MyID和ZXID后,先比对ZXID,选取最大的那个,如果ZXID一样,则选取MyID最大的,重新投票。


ZooKeeper架构

上面其实已经把ZooKeeper的原理细细的捋了一遍,一句话总结,其实就是二阶段递交+过半写+选举机制。

ZooKeeper一共定义了3种角色:

Leader:全局唯一,负责进行投票的发起和决议,更新系统状态;

Follower:收集客户端的请求,并返回结果,参与投票;

ObServe:提供客户端的读服务,不参与投票,只同步leader的状态。

ZooKeeper的每个节点都会存储所有的数据,他们会进行实时的同步。因为ZooKeeper只负责解决一致性的问题,所以其实它们需要存储的数据并不多,因此可以做到每个节点都存储所有数据。


ZooKeeper的Watch机制

ZooKeeper在帮助集群达成一致之后,还提供了数据的发布/订阅的功能,这个功能就是通过Watch机制来实现的。

大致的逻辑是这样的:

  • 客户端向ZooKeeper发起注册Watch的请求;
  • ZooKeeper注册Watch监听
  • 客户端把Watch对象存储在Watch Manager中
  • ZooKeeper持续监听事件
  • 一旦事件触发,ZooKeeper通知客户端

这样我们就可以得到非常高效的集群内部各种信息发现的服务。这样我们就可以监听节点数据变更、节点删除、子节点状态变更等事件,非常的好用。基于这个功能,我们可以把ZooKeeper当做服务发现、数据订阅等用途。


总结

ZooKeeper通过ZAB协议,做到集群内数据一致性;

通过选举机制解决Leader单点问题;

通过Watch提供各种监听、通知的服务。

另外还有Znode、ACL权限控制等内容去完成数据存储和权限控制的功能。

所以ZooKeeper的功能非常强大,用架构师的话来说,所有分布式系统中的疑难杂症可以直接扔给ZooKeeper,让它给一个结果。

这里罗列一下ZooKeeper的用途:

  • 统一命名服务
  • 分布式锁
  • 数据发布与订阅(配置管理)
  • 负载均衡
  • 分布式通知/协调
  • 集群管理与Master选举
  • 分布式队列

所以也就不奇怪,为啥kafka、Hbase等组件必须强依赖ZooKeeper了,因为它的能力可以完美满足这些组件的各种需求。

相关文章
|
6月前
|
消息中间件 分布式计算 资源调度
《聊聊分布式》ZooKeeper与ZAB协议:分布式协调的核心引擎
ZooKeeper是一个开源的分布式协调服务,基于ZAB协议实现数据一致性,提供分布式锁、配置管理、领导者选举等核心功能,具有高可用、强一致和简单易用的特点,广泛应用于Kafka、Hadoop等大型分布式系统中。
|
10月前
|
数据采集 机器学习/深度学习 数据可视化
让回归模型不再被异常值"带跑偏",MSE和Cauchy损失函数在噪声数据环境下的实战对比
本文探讨了MSE与Cauchy损失函数在线性回归中的表现,特别是在含噪声数据环境下的差异。研究发现,MSE虽具良好数学性质,但对异常值敏感;而Cauchy通过其对数惩罚机制降低异常值影响,展现出更强稳定性。实验结果表明,Cauchy损失函数在处理含噪声数据时参数估计更接近真实值,为实际应用提供了更鲁棒的选择。
387 1
让回归模型不再被异常值"带跑偏",MSE和Cauchy损失函数在噪声数据环境下的实战对比
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
1235 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
存储 SpringCloudAlibaba Java
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论。
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
|
SQL 分布式计算 数据处理
云产品评测|分布式Python计算服务MaxFrame | 在本地环境中使用MaxFrame + 基于MaxFrame实现大语言模型数据处理
本文基于官方文档,介绍了由浅入深的两个部分实操测试,包括在本地环境中使用MaxFrame & 基于MaxFrame实现大语言模型数据处理,对步骤有详细说明。体验下来对MaxCompute的感受是很不错的,值得尝试并使用!
369 1
|
存储 运维 NoSQL
分布式读写锁的奥义:上古世代 ZooKeeper 的进击
本文作者将介绍女娲对社区 ZooKeeper 在分布式读写锁实践细节上的思考,希望帮助大家理解分布式读写锁背后的原理。
391 11
|
分布式计算 NoSQL Java
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
257 2
|
SQL NoSQL 安全
分布式环境的分布式锁 - Redlock方案
【10月更文挑战第2天】Redlock方案是一种分布式锁实现,通过在多个独立的Redis实例上加锁来提高容错性和可靠性。客户端需从大多数节点成功加锁且总耗时小于锁的过期时间,才能视为加锁成功。然而,该方案受到分布式专家Martin的质疑,指出其在特定异常情况下(如网络延迟、进程暂停、时钟偏移)可能导致锁失效,影响系统的正确性。Martin建议采用fencing token方案,以确保分布式锁的正确性和安全性。
305 0
|
8月前
|
存储 负载均衡 NoSQL
【赵渝强老师】Redis Cluster分布式集群
Redis Cluster是Redis的分布式存储解决方案,通过哈希槽(slot)实现数据分片,支持水平扩展,具备高可用性和负载均衡能力,适用于大规模数据场景。
567 2
|
8月前
|
存储 缓存 NoSQL
【📕分布式锁通关指南 12】源码剖析redisson如何利用Redis数据结构实现Semaphore和CountDownLatch
本文解析 Redisson 如何通过 Redis 实现分布式信号量(RSemaphore)与倒数闩(RCountDownLatch),利用 Lua 脚本与原子操作保障分布式环境下的同步控制,帮助开发者更好地理解其原理与应用。
640 6