详解分布式应用程序协调服务Zookeeper

本文涉及的产品
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
简介: 详解分布式应用程序协调服务Zookeeper

主从结构:HDFS、Yarn、HBase、storm、spark、zookeeper都存在单点故障问题


hadoop1.x没有解决方案


hadoop2.x利用zookeeper实现HA


zookeeper是开源的分布式应用程序协调服务,是Google chubby的开源实现


zookeeper相当于一个数据库,可以实现HA,zookeeper的功能:配置管理、集群管理、分布式锁


zookeeper的体系结构:leader和follower


zookeeper集群本身具有leader选举功能(解决单点故障问题,因此zookeeper集群至少需要三台)和数据同步功能(保证数据的安全性),


选举端口号:3888,同步端口号:2888


zookeeper也支持单点部署,不存在leader选举功能(paxos协议)和数据同步功能(zab协议),状态:standalone(单独的、独立的)


paxos协议的核心思想:当多数server写成功,则任务数据写成功。如果有3个server,则两个写成功即可。


安装和配置zookeeper:


安装zookeeper:


tar -zxvf zookeeper-3.4.10.tar.gz -C ~/training


配置zookeeper:配置ZOOKEEPER_HOME环境变量:


vim ~/.bash_profile
export ZOOKEEPER_HOME=/root/training/zookeeper-3.4.10
                export PATH=$ZOOKEEPER_HOME/bin:$PATH
source ~/.bash_profile

         

zookeeper的核心配置文件:conf/zoo.cfg 使用cp zoo_sample.cfg zoo.cfg得到zoo.cfg


zookeeper的安装模式:


1、单点模式:一台机器,不存在leader选举功能和数据同步功能 状态:standalone


修改配置文件zoo.cfg:


1、指定zookeeper中数据保存的目录:


dataDir=/root/training/zookeeper-3.4.10/tmp


2、指定zookeeper的主机是谁:


server.1=bigdata11:2888:3888


3、指定server.1的myid:1


2、集群模式:至少三台机器以上  具有leader选举功能和数据同步功能 状态:一个leader,多个follower


1、在bigdata12上安装和配置zookeeper:


安装zookeeper:tar -zxvf zookeeper-3.4.10.tar.gz -C ~/training


配置zookeeper:配置ZOOKEEPER_HOME环境变量:


ZOOKEEPER_HOME=/root/training/zookeeper-3.4.10
PATH=$ZOOKEEPER_HOME/bin:$PAHT


2、修改配置文件zoo.cfg:


1、指定zookeeper中数据保存的目录:


dataDir=/root/training/zookeeper-3.4.10/tmp


2、指定zookeeper的主机:


server.1=bigdata12:2888:3888
server.2=bigdata13:2888:3888
server.3=bigdata14:2888:3888


3、指定server.1的myid:1


3、把bigdata12上的zookeeper复制到其他节点上:


scp -r zookeeper-3.4.10 root@bigdata12:/root/training
scp -r zookeeper-3.4.10 root@bigdata13:/root/training
scp -r zookeeper-3.4.10 root@bigdata14:/root/training


4、修改bigdata13和bigdata14上的myid文件:


5、在每个节点上启动zookeeper:zkServer.sh start


zookeeper的数据模型:


zookeeper的数据模型类似于Linux文件系统,呈树形结构,每个目录称作一个z节点,每个z节点上可以存储少量数据,默认1M


  • 启动zookeeper:zkServer.sh start


  • 停止zookeeper:zkServer.sh stop


  • 查看zookeeper的状态:zkServer.sh status


  • 启动zookeeper的客户端命令行工具:zkCli.sh


  • zookeeper的客户端命令行工具端口号:2181


  • 在zookeeper中创建节点添加数据:create /mydata helloworld


  • 在zookeeper中查看节点:get /mydata


作者:李金泽AllenLi,清华大学在读硕士,研究方向:大数据和人工智能


相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
1月前
|
存储 缓存 算法
分布式锁服务深度解析:以Apache Flink的Checkpointing机制为例
【10月更文挑战第7天】在分布式系统中,多个进程或节点可能需要同时访问和操作共享资源。为了确保数据的一致性和系统的稳定性,我们需要一种机制来协调这些进程或节点的访问,避免并发冲突和竞态条件。分布式锁服务正是为此而生的一种解决方案。它通过在网络环境中实现锁机制,确保同一时间只有一个进程或节点能够访问和操作共享资源。
71 3
|
1月前
|
消息中间件 监控 Ubuntu
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
77 3
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
|
1月前
|
监控 Dubbo Java
dubbo学习三:springboot整合dubbo+zookeeper,并使用dubbo管理界面监控服务是否注册到zookeeper上。
这篇文章详细介绍了如何将Spring Boot与Dubbo和Zookeeper整合,并通过Dubbo管理界面监控服务注册情况。
84 0
dubbo学习三:springboot整合dubbo+zookeeper,并使用dubbo管理界面监控服务是否注册到zookeeper上。
|
1月前
|
分布式计算 NoSQL Java
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
43 2
|
1月前
|
分布式计算 Hadoop
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
47 1
|
2月前
|
数据采集 分布式计算 MaxCompute
MaxCompute 分布式计算框架 MaxFrame 服务正式商业化公告
MaxCompute 分布式计算框架 MaxFrame 服务于北京时间2024年09月27日正式商业化!
90 3
|
1月前
|
存储 SQL 消息中间件
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
47 0
|
1月前
|
NoSQL Java Redis
太惨痛: Redis 分布式锁 5个大坑,又大又深, 如何才能 避开 ?
Redis分布式锁在高并发场景下是重要的技术手段,但其实现过程中常遇到五大深坑:**原子性问题**、**连接耗尽问题**、**锁过期问题**、**锁失效问题**以及**锁分段问题**。这些问题不仅影响系统的稳定性和性能,还可能导致数据不一致。尼恩在实际项目中总结了这些坑,并提供了详细的解决方案,包括使用Lua脚本保证原子性、设置合理的锁过期时间和使用看门狗机制、以及通过锁分段提升性能。这些经验和技巧对面试和实际开发都有很大帮助,值得深入学习和实践。
太惨痛: Redis 分布式锁 5个大坑,又大又深, 如何才能 避开 ?
|
3月前
|
NoSQL Redis
基于Redis的高可用分布式锁——RedLock
这篇文章介绍了基于Redis的高可用分布式锁RedLock的概念、工作流程、获取和释放锁的方法,以及RedLock相比单机锁在高可用性上的优势,同时指出了其在某些特殊场景下的不足,并提到了ZooKeeper作为另一种实现分布式锁的方案。
113 2
基于Redis的高可用分布式锁——RedLock
|
12天前
|
NoSQL Redis
Redis分布式锁如何实现 ?
Redis分布式锁通过SETNX指令实现,确保仅在键不存在时设置值。此机制用于控制多个线程对共享资源的访问,避免并发冲突。然而,实际应用中需解决死锁、锁超时、归一化、可重入及阻塞等问题,以确保系统的稳定性和可靠性。解决方案包括设置锁超时、引入Watch Dog机制、使用ThreadLocal绑定加解锁操作、实现计数器支持可重入锁以及采用自旋锁思想处理阻塞请求。
47 16

热门文章

最新文章

下一篇
无影云桌面