1.HBase集群环境介绍
HBase集群由多个RegionServer节点和一个或多个HMaster节点组成。HMaster节点负责管理元数据(例如表的位置、分区等),并协调集群中的各个节点。RegionServer节点负责存储和处理数据,并与HMaster节点通信以获取元数据信息。
HBase集群的主要特点包括:
可靠性:HBase采用数据副本和RegionServer读写分离等机制来实现容错和恢复能力,即使部分节点出现故障,集群仍然可用。
高性能:HBase通过将表分割成不同的Region来进行水平扩展,可以处理海量数据并具有很高的读写性能。
数据模型:HBase提供类似于Google的Bigtable的列族存储模型,可以灵活定义列族和列,支持动态添加或删除列族和列。
多版本控制:HBase支持存储多个版本的数据,可以回滚到先前的状态,也可以查询以前的历史值。
2.搭建环境准备
本次用到的环境有:
Oracle Linux 7.4
Zookeeper3.4.6集群环境
Hadoop2.7.4集群环境
注:HBase依赖于ZooKeeper来进行分布式协调和管理,因此在搭建启用HBASE之前,需要提前搭建并启动好zookeeper集群环境
3.搭建步骤
1.启动zookeeper集群环境
2.解压HBase压缩文件至/opt目录。
tar -zxvf /root/experiment/file/hbase-1.2.6-bin.tar.gz -C /opt
3.修改解压后文件夹的名字为hbase。
cd /opt mv /opt/hbase-1.2.6 /opt/hbase
4.查找Java安装路径
echo $JAVA_HOME
5.配置hbase-env.sh文件
vim /opt/hbase/conf/hbase-env.sh
6.按键:set nu回车设置行号,部分截图如下
7.按键27gg,光标定位到27行,部分截图如下
8.按键 i ,更改代码如下:
export JAVA_HOME=/usr/lib/java-1.8
9.按键Esc,按键128gg,光标定位到128行,部分截图如下
10.按键 i ,设置HBase使用外部独立Zookeeper集群,更改代码如下:
export HBASE_MANAGES_ZK=false
11.按键Esc,按键”:wq!”保存退出。
12.配置hbase-site.xml文件
vim /opt/hbase/conf/hbase-site.xml
13.按键:set nu回车设置行号,部分截图如下
14.按键24gg,光标定位到24行,部分截图如下
15.按键 i ,在标签之间填加代码如下:
<property> <name>hbase.zookeeper.quorum</name> <value>master,slave1,slave2</value> </property> <property> <name>hbase.zookeeper.property.dataDir</name> <value>/root/hbase</value> </property> <property> <name>dfs.datanode.max.transfer.threads</name> <value>4096</value> </property> <property> <name>hbase.rootdir</name> <value>hdfs://master:8020/hbase</value> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property>
16.按键Esc,按键”:wq!”保存退出。
17.配置regionservers文件
vim /opt/hbase/conf/regionservers
18.按键dd,删除第一行“localhost”,截图如下