开发者学堂课程【NoSQL 数据库 Kudu 教程:安装部署—集群启动&;web ui&;注意事项】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/723/detail/12902
安装部署—集群启动&;web ui&;注意事项
内容介绍:
一、 安装 ntp 服务
二、 启动、关闭 kudu 集群
三、 Kudu web UI
一、安装 ntp 服务
了解 kudu 集群的启动和关闭,在去启动 kudu 之前,必须去安装一个 NTP 的网络时间同步的一个服务,因为 kudu会去检测这个服务是否安装,要保证的集群之间,时间是正常的,所以这个一定要提前安装一下,在计算机首页之下同样的操作,用 yum 的项目再去安装叫做 NTP,下面执行好,already 已经成功安装,
之后把这个服务设置为的开机启动,并且,让立即先启动执行一下,启动一个,之后再 chkconfing ntpd on,永久的开机启动,设置好之后,要重启一下这个服务,保证它当下是正常的,用这个命令,完成好之后说明 NTP 网络授时服务是正常的,这个是关键,要不然后面启动可能报一个错。
二、启动、关闭 kudu 集群
集群的 kudu 集群的启动,启动起来,每台机器上启动的 master,叫做设备是 service kudu master start,关闭用stop,在这里规划的时候,三台机器都启动了,Master,然后也都有 tserver 的,所以直接把命令三台机器,同时执行复制一下,首先三台机器都启动的 kudu master,同样的计算机,将来启动的 t server,启动好之后,验证进程是否正常就要注意通过 aps 不能插作业,ps-ef,然后,去过滤一下 grape,叫做 kudu,如果发现有两个进程,master和社保这样的服务,说明三台机器启动就成功,
如果没有成功,这里很正常,如果没有筹办,失败了,一定要去到日志路径下判断日志,根据日志来排除,日志在哪里,如果搭建的时候,每个服务日志都指定了,就在这个路径下,默认情况下,VD 路径下的落下的 kudu,比如随便找台机器,Cd 到var 路径下。Log 下的叫做 kudu 当中 Cd,进行到,这里面就列举出来了,
master 服务和 t server 服务的相关的一个信息,info 信息还有 warning,现在没有启动失败,所以就没有 error,如果发现这边有 error,应该就是出错了,这里做软链接怎样不管,但是可以看出来这里面日志的相关情况,所以输错看这里是看不出来的,刚才一启动,就启动了,然后,到底有什出问题也看不出来,所以根据日志是你判错的最好的一句。如果关闭,把它改为 stop 就可以了。
三、kudu web UI
启动完之后,可以来到 kudu 提供的外部页面上进行相关的查看。外部页面,因为这里都有三台 master,所以访问地人都是 Master 所在机器的主机米加上8081的端口,接下来看一下,比如说来到 note 杠一是的8081回车,这时候可以连接到的 kudu 上,但是也不要忘记了三代机上是不是都部署了 kudu,但是这时候可以访问 note-2回车,也可以打开,然后 note-3也部署 master 也是访问,就知道管理页面就是位于 master 所在机器的8081,但虽然三台机器都是 master,但是并不是都是对外提供服务的,这个 kudu 的页面,打开起来如下图,里面很多信息,配置信息,比如看配置机器哪里有问题,重点看相关日志,
第一个点击的 masters 后面 S 表示现在很多 master,点击这个之后你会发现。当下它会列出来,整个 kudu 集群有三个 master,这三个 master 中,并不是都叫 master 的,首先 UUID 是每个 master 的一个唯一编号,不重复加看角色,看这个 master,它叫 leader,这两个叫 flow,这个 leader,它位于153是 note-3上,下面是 note-1,note-2上,刚才启动了三个 master,但是这三个 master当中,对于 note-3上面的这个兄弟,是 leader,是 master 当中活跃的主角色,剩下两个,是一个追随者,是备份,它挂在了可以顶上,所以这里就形成了一个主备的关系,后面会显示出来,访问 RBCD 支付端口,以及 FTP 的端口,8051是因为这里只是8051的端口,注意7051是 RBC 的地址和端口,理解 RBC 和 HTTP2个协议,用 HTTP,就是通过浏览器去访问,如果想使用,请使用 RPC 地址来访问,一个是看一个是用,第一点后面会显示版本信息,这是第一部分重点关注的叫 memory,看一下 master 启动正常。
另外一个,后面的 memory 内存的相关信息,当前内存的使用情况有多大多小,重点还看后面叫做 Tablet server,下面整个 kudu 集群有几个小弟,当下发现了总共 They are 3个注册的 tabletive5这写的很积极,这三个注册暂时不见得都是活跃的,下面还有描述当中三个是来活跃的。还有零个是失败的,如果有的时候启动发现两个成功,一个失败,就得关心哪个失败,这里会显示三个 tablet server 位于的机器,比如这里都有唯一的主机,位于哪些机器上,该过多少,都可以查看,这个链接,点进去查看具体的这个 tablet 服务的相关信息,还有一个需要注意的就叫做tablets,kudu 作为一个存储系统,最终数据是以表的形式来存放的,
点击 Tablet,当下当中所位于的表,现在的 kudu 刚刚搭建成功,没有任何的表,这里 master is not the leader,现在在 note-1上不让访问,现在的这个 note master 不是 leader,要想看起到 master 标页面,点击 master 自动测量刚才这是不是也从侧面上告诉主备之间同一时间只能有一个对外提供服务,所以现在只能去访问 note-3,因为是 need,这样就完成了 kudu 中的启动以及 kudu web UI 页面,
当中的 master tables 以及 tablet server 这三个是重点关注的,点一点击,启动过程中还有一些注意事项,需要在这里大家统一的注意一下。
第一个就是 sudo 权限,因为很多时候在企业当中,可能会使用普通用户,所以 sudo 可能报错,你跟的 sudo 这个文件夹,这个文件,给收一个555的权限。
另外一个,就是启动 kudu 的时候可能会爆一些这样的错误,比如你会出现不能够初始化 clock 时钟,Every reading clock 是不是本地没有安装 NTP 服务。yums 安装好,然后重新的启动,就会解决这个问题了。
另外一个,会报一个这样错,不能够去初始化什 catalog 的 manage 管理服务,这时候,把启动的赶快停掉,把这两个路径下的所有文件给重新删除,重新启动可能是之前启动不正常造成的,
另外一个,启动要报错,一旦看到 promising delight 全权拒绝,这就是权限问题,kudu 集群包括 inpart 文件,特点很类似,默认都是以当前软件的名字这个用户来启动的。比如启动 kudu 的时候,事实上并不是 note,哪怕是在做的用户,也是以 kudu 的这个角色去启动的。这是要涉及到要去启动所操作的这个文件夹下面有没有满足的权限,要看看要报哪个都不行就把这个文件夹切克的 owner,把它修改为的 kudu 用户和 kudu 用户组,这样就满足。这几个问题应该是比较常见的,其中还包括初心来就结合日志来具体判断,这样就完成了的 kudu 启动,如果要关闭,把刚才当中的每个 stop 改为的 stop,就可以关闭的 kudu 集群,这是 kudu 的一个外部优化,启动和关闭以及注意事项。