ZooKeeper 技术内幕初探(二)

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: 前面介绍了ZooKeeper的一些基本特性,ZooKeeper入门,也安装运行了一个简单的ZooKeeper的例子。这此主要介绍ZooKeeper内部的一些工作方式理论部分。

前面介绍了ZooKeeper的一些基本特性,ZooKeeper入门,也安装运行了一个简单的ZooKeeper的例子。这此主要介绍ZooKeeper内部的一些工作方式理论部分。

img_c41c03d784adacd512001d9fe420e1a6.png
与文无关

主要涉及以下:

  • ZooKeeper服务的架构
  • ZooKeeper的数据模型
  • ZooKeeper的节点特性
  • ZooKeeper的访问控制
  • Watcher(监听器)

ZooKeeper服务概览

ZooKeeper是一个复制式的分布式应用,有点像DNS服务或一些中心化的服务。


img_d595e8ee881c495e71462b7c7777d904.png
ZooKeeper服务架构

这是官网给的ZooKeeper服务图,所有组成ZooKeeper服务的服务器都相互知晓,它们维护了一个内存状态的镜像,也包含事务日志,持久存储的快照等。只要半数以上的的服务器是可用的,ZooKeeper服务就是可用的。

顺便提一下ZooKeeper的设计目标(Design Goals)

  • 简单
  • 复制式的 所有节点相互复制状态
  • 有序的,所有的事务都有时间戳
  • 快速 在读大于写的时候...
img_199da8a69957fc8e2d43769eeae8fdc0.png
ZooKeeper读写图

ZooKeeper在读数据的时候可以直接从当前节点读取数据,在写数据的时候需要将写请求转发到Leader节点上。

ZooKeeper数据模型

ZooKeeper的各个服务器节点共同维护一个可以注册数据的层级结构,类似于Unix的文件系统。数据注册的位置也称为znode

img_4c1d8cd1e176661982d84b8c17188c29.png
Znode图

注意

  • 数据节点一般以字节形式存储,节点存储的数据大小最大不超过1MB。协作的数据一般不会太大。最好让数据远小于1MB会好些。
  • ZooKeeper无法识别相对路径。 znode的路径必须是绝对路径
  • 每个Znode除了存储数据以外,还有维护一些状态信息。

Znode 特性

Znode类型

ZooKeeper主要有两种节点类型,也可以说是三种。持久节点,临时节点。第三个是顺序节点,顺序节点也可以说是刚才那两种节点。 持久节点和顺序节点都可以是顺序节点。
注意节点的类型是在创建的时候就设置好的。

  • 持久节点。ZooKeeper中最常见的一种节点类型,创建之后一直存在服务器上,知道有删除操作来主动清楚这个节点
  • 临时节点,与客户端会话绑定在一起。 客户端会话失效,节点自动清理。(网络突然坏掉不算会话失效)
  • 顺序节点,在节点创建的时候,ZooKeeper自动给节点名分配一个序列号。例如/path/to/znode-0000000001,一般是10位数字,序号之外的位以0填充。
节点状态

每一个Znode都有对应的stat结构,和文件系统类似。stat状态主要包含下面的信息:

  • cZxid. 节点被创建时候的事务ID
  • mZxid 节点最后一次被修改时候的事务ID
  • pZxid 该节点的子节点最后一次被修改时的事务ID。子节点删除或添加才会影响pZxid
  • ctime 节点被创建的时间
  • mtime 节点被修改的世界
  • dataVersion 这个节点数据改变的次数
  • cversion 子节点被改变的次数
  • aclVersion 节点的ACL(访问控制列表被改变的次数)
  • ephemeralOwner 创建该临时节点的 session ID。如果是持久节点,设置为0
  • dataLength 数据内容长度
  • numChildren 当前节点子节点的个数

可以使用ls2stat命令查看ZooKeeper节点下的信息。

img_31731f766685137ca7d70f89e187baa2.png
命令演示

ZooKeeper的访问控制(ACL)

ZooKeeper的数据模型提供了ACL来控制znode节点的访问。如果一个客户端符合ACL控制,那么就可以对其进行访问,否则将无法操作。

Zookeeper支持可配置的认证机制。它利用一个三元组来定义客户端的访问权限:

(scheme:expression, perms) 。其中:

  1. Schema 代表权限控制模式,分别为
  • World 任何人
  • Auth 不需要ID
  • Digest 用户名和密码方式的认证
  • IP Address IP地址方式的认证
  1. perms(权限),ZooKeeper支持如下权限
  • CREATE: 创建子节点
  • READ: 获取子节点与自身节点的数据信息
  • WRITE:在Znode节点上写数据
  • DELETE:删除子节点
  • ADMIN:设置ACL权限

贴上如下图,在下次使用ZooKeeper的时候更明白,这次我们主要说明一些ZooKeeper理论方面的知识,具体编程的实现下次再说。

img_95e7f90fa6417ec49e56cfcf004b7805.png
ACL图

权限模式和授权对象的关系:

  • IP: 通常是IP地址或是IP端,例如"192.168.1.2"或"192.168.1.1/24"
  • Degist: 自定义,通常是"username:BASE64(SHA-1(username:password))"
  • World:只有一个ID,“anyone”
  • Super: 与Degist模式一致

注意

  • Znode的Acl只是针对某个节点,不会作用到它的子节点上
  • 任何连接到ZooKeeper的客户端都可以使用exist操作,exist是不需要权限的。

ZooKeeper的Watcher

ZooKeeper中引入了Watcher机制来实现分布式通知功能,ZooKeeper允许客户端像服务端注册一个Watcher监听,当服务端的一些指定事件触发了这个Watcher,那么就会向指定客户端发送一个事件通知来实现分布式的通知功能。

有如下的Watcher事件类型可能出现:

  • NodeChildrenChanged: zNode的子节点创建或删除的时候
  • NodeCreated: 新的Znode节点被创建的时候
  • NodeDataChanged: Znode节点的数据改变了的时候
  • NodeDeleted: Znode节点被删除的时候。

关于Watcher内部实现机制,下次可以通过分析其源码进行更详细的说明

最后

这次主要介绍了一些ZooKeeper内部的基本概念,理论部分较多,若无理论的基础实施接下来的操作也不太方便。

接下来我会写下:

  • ZooKeeper 客户端编程
  • ZooKeeper Watcher监听器原理分析

参考

  • 《从Paxos到ZooKeeper-分布式一致性原理与实践》
  • 《Apache ZooKeeper Essential》
  • ZooKeeper Overview
相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
8月前
|
存储 Shell 网络安全
Zookeeper笔记
Zookeeper笔记
100 0
|
存储 网络协议 数据管理
zookeeper深入浅出 1
zookeeper深入浅出
114 0
|
存储 Java 数据库
zookeeper深入浅出 2
zookeeper深入浅出
93 0
|
存储 消息中间件 设计模式
zookeeper入门(一)
Zookeeper 是一个开源的分布式的,为分布式应用提供协调服务的 Apache 项目
130 0
|
存储
zookeeper入门(二)
接触zookeeper也有一段时间了,一直有一个问题困扰着我,那就是zookeeper在codis中扮演什么角色,zookeeper中到底存储了哪些数据。
64 0
|
存储 负载均衡 Dubbo
Zookeeper的常见面试题(全)
目录前言1. Zookeeper的了解2. ZAB协议 / 主从节点的同步了解3. 多少种部署方式4. 通知机制5. 集群节点的个数6. 节点的类型有什么7. 集群安装的特点8. 选举机制是如何的 前言 主要理顺zookeeper的相关知识点以及面试常被问及的知识点 基础知识可看我之前的文章 Zookeeper从入门到精通(全) 1. Zookeeper的了解 zookeeper主要是文件系统(存储数据)和通知机制(进行通知信息) 它是一个为分布式应用提供一致性服务的软件 具体都有哪些些功能 统一命名服务
342 1
Zookeeper的常见面试题(全)
|
存储 缓存 负载均衡
ZooKeeper面试题
zookeeper用来注册服务和进行负载均衡,哪一个服务由哪一个机器来提供必需让调用者知道,简单来说就是ip地址和服务名称的对应关系。当然也可以通过硬编码的方式把这种对应关系在调用方业务代码中实现,但是如果提供服务的机器挂掉调用者无法知晓,如果不更改代码会继续请求挂掉的机器提供服务。zookeeper通过心跳机制可以检测挂掉的机器并将挂掉机器的ip和服务对应关系从列表中删除。至于支持高并发,简单来说就是横向扩展,在不更改代码的情况通过添加机器来提高运算能力。通过添加新的机器向zookeeper注册服务,服务的提供者多了能服务的客户就多了。
ZooKeeper面试题
|
存储 负载均衡 监控
Zookeeper入门
Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目 ZooKeeper字面意思:动物园管理员,把服务器比作是动物,它作为一个管理者的身份,监控着从它上面注册过的服务,客户端可以通过ZooKeeper来了解服务的运行情况。
Zookeeper入门
|
存储 设计模式 分布式计算
入门Zookeeper(一)
入门Zookeeper(一)
207 0
入门Zookeeper(一)
|
存储 设计模式 负载均衡