阿里云
为了无法计算的价值
打开APP
阿里云APP内打开
学习中心> 大数据ZooKeeper快速入门> 正文

大数据ZooKeeper快速入门

28课时 |
2031人已学 |
免费
课程介绍

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。 

ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。

ZooKeeper概述&特性

目录:

  1. Zookeeper概述
  2. Zookeeper特性

 

Zookeeper概述

首先,Zookeeper是一个开源框架,一个分布式协调服务的框架

应用在分布式环境下去进行某种数据的访问。

Zookeeper是一个分布式协调服务的开源椎架。主要用来解决分布式集群中应用系统的一致性问题,例如怎样避免同时操作同一数据造成脏读的问题。有了协调服务保证分布式系统按照某种规则进行有序访问

ZooKeeper本质上是一个分布式的小文件存储系统。

小文件存储系统即存储系统就是目录树,例如Windows平台,根目录下面创建子文件夹,存储小文件不会太大,针对分布式环境进行,搭建需要搭建多台机器,文件系统上进行相关的增删改查,具有自己特有的特征。

提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。诸如:统一命名服务、分布式配置管理、分布式消息队列、分布式锁、分布式协调等功能。

 

Zookeeper特性
  1. 全局数据一致性(最重要的特性)

Zookeeper自己是一个分布式系统,决定了它需要部署多台服务器上,每个server保存一份相同的数据副本,client无论连

接到哪个server,展示的数据都是一致的,这是最重要的特征;

图例理解:

三台机器上运行Zookeeper,分别为node-1,node-2,node-3,三个共同组成集群,不管客户端连接那台机器上查看的数据都是一致的,例如在node-1下有/aaa文件夹,下面分别有1.txt和2.txt,再其他三台服务器上也可查看此目录

  1. 可靠性

如果消息被其中一台服务器接受,那么将被所有的服务器接受。消息即增删改查,例如删除/aaa下的2.txt,即为一个消息,目的是保证全局一致性

  1. 顺序性

目的也是保证数据的全局一致性所产生的。包括全局有序和偏序两种:

全局有序是指如果在一台服务器上消息a在消息b前发布,则在所有Server 上消息a都将在消息b前被发布;

偏序是指如果一个消息b在消息a后被同一个发送者发布,a必将排在b前面。

  1. 数据更新原子性:

一次数据更新要么成功(半数以上节点成功),要么失败,不可能存在中间状态。一旦成功所有的机器都成功,一旦失败所有的机器都失败,成功标准为半数以上节点成功,半数即两台,两台成功第三台马上同步

  1. 实时性:

Zookeeper保证客户端将在一个时间间隔范围内获得服务器的更新信息,或者服务器失效的信息。

 

我的学习进度
请登录后查看您的学习进度!
立即登录
本课程相关云产品