HBase 快速入门(安装和命令操作)

本文涉及的产品
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
简介: HBase 快速入门(安装和命令操作)

1 HBase 安装部署


1.1 Zookeeper 正常部署


首先保证 Zookeeper 集群的正常部署,并启动。

bin/zkServer.sh start
bin/zkServer.sh start
bin/zkServer.sh start


1.2 Hadoop 正常部署


Hadoop 集群的正常部署并启动。

sbin/start-dfs.sh
sbin/start-yarn.sh


1.3 HBase 的解压


1)解压 Hbase 到指定目录

tar -zxvf hbase-2.4.11-bin.tar.gz -C /opt/module/
mv /opt/module/hbase-2.4.11 /opt/module/hbase


2)配置环境变量

sudo vim /etc/profile.d/my_env.sh

添加

#HBASE_HOME
export HBASE_HOME=/opt/module/hbase
export PATH=$PATH:$HBASE_HOME/bin


3)使用 source 让配置的环境变量生效

source /etc/profile.d/my_env.sh


1.4 HBase 的配置文件


1)hbase-env.sh 修改内容(不使用hbase自带zk),可以添加到最后:

export HBASE_MANAGES_ZK=false

2)hbase-site.xml 修改内容:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>hbase.zookeeper.quorum</name>
        <value>hadoop102,hadoop103,hadoop104</value>
        <description>The directory shared by RegionServers.</description>
    </property>
    <!-- <property>-->
    <!-- <name>hbase.zookeeper.property.dataDir</name>-->
    <!-- <value>/export/zookeeper</value>-->
    <!-- <description> 记得修改 ZK 的配置文件 -->
    <!-- ZK 的信息不能保存到临时文件夹-->
    <!-- </description>-->
    <!-- </property>-->
    <property>
        <name>hbase.rootdir</name>
        <value>hdfs://hadoop102:8020/hbase</value>
        <description>The directory shared by RegionServers.</description>
    </property>
    <property>
        <name>hbase.cluster.distributed</name>
        <value>true</value>
    </property>
</configuration>


3)regionservers

hadoop102
hadoop103
hadoop104


4)解决 HBase 和 Hadoop 的 log4j 兼容性问题,修改 HBase 的 jar 包,使用 Hadoop 的 jar 包

mv /opt/module/hbase/lib/client-facingthirdparty/slf4j-reload4j-1.7.33.jar /opt/module/hbase/lib/clientfacing-thirdparty/slf4j-reload4j-1.7.33.jar.bak


1.5 HBase 远程发送到其他集群


xsync hbase/


1.6 HBase 服务的启动


1)单点启动

bin/hbase-daemon.sh start master
 bin/hbase-daemon.sh start regionserver


2)集群启动

bin/start-hbase.sh

3)对应的停止服务

bin/stop-hbase.sh


1.7 查看 HBase 页面


启动成功后,可以通过“host:port”的方式来访问 HBase 管理页面,例如:http://ip:16010


1.8 高可用(可选)


在 HBase 中 HMaster 负责监控 HRegionServer 的生命周期,均衡 RegionServer 的负载,

如果 HMaster 挂掉了,那么整个 HBase 集群将陷入不健康的状态,并且此时的工作状态并不

会维持太久。所以 HBase 支持对 HMaster 的高可用配置。


1)关闭 HBase 集群(如果没有开启则跳过此步)

bin/stop-hbase.sh

2)在 conf 目录下创建 backup-masters 文件

touch conf/backup-masters

3)在 backup-masters 文件中配置高可用 HMaster 节点

echo hadoop103 > conf/backup-masters

4)将整个 conf 目录 scp 到其他节点

xsync conf

5)重启 hbase,打开页面测试查看

http://ip:16010


2 HBase Shell 操作


2.1 基本操作


1)进入 HBase 客户端命令行

bin/hbase shell

2)查看帮助命令

 能够展示 HBase 中所有能使用的命令,主要使用的命令有 namespace 命令空间相关,DDL 创建修改表格,DML 写入读取数据。

help


2.2 namespace


1)创建命名空间

使用特定的 help 语法能够查看命令如何使用。

help 'create_namespace'

2)创建命名空间 bigdata

create_namespace 'bigdata'

3)查看所有的命名空间

list_namespace


2.3 DDL


1)创建表

在 bigdata 命名空间中创建表格 student,两个列族。info 列族数据维护的版本数为 5 个,如果不写默认版本数为 1。

create 'bigdata:student', {NAME => 'info', VERSIONS => 5}, {NAME => 'msg'}

如果创建表格只有一个列族,没有列族属性,可以简写。

如果不写命名空间,使用默认的命名空间 default。

create 'student1','info'

2)查看表

查看表有两个命令:list 和 describe

list:查看所有的表名

list

describe:查看一个表的详情

describe 'student'

3)修改表

表名创建时写的所有和列族相关的信息,都可以后续通过 alter 修改,包括增加删除列族。

(1)增加列族和修改信息都使用覆盖的方法

alter 'student', {NAME => 'f1', VERSIONS => 3}

(2)删除信息使用特殊的语法

alter 'student', NAME => 'f1', METHOD => 'delete'
alter 'student', 'delete' => 'f1'


4)删除表

shell 中删除表格,需要先将表格状态设置为不可用。

disable 'student'
drop 'student1'


2.4 DML


1)写入数据

在 HBase 中如果想要写入数据,只能添加结构中最底层的 cell。可以手动写入时间戳指定 cell 的版本,推荐不写默认使用当前的系统时间。

put 'bigdata:student','1001','info:name','zhangsan'
put 'bigdata:student','1001','info:name','lisi'
put 'bigdata:student','1001','info:age','18'


如果重复写入相同 rowKey,相同列的数据,会写入多个版本进行覆盖。


2)读取数据

读取数据的方法有两个:get 和 scan。

get 最大范围是一行数据,也可以进行列的过滤,读取数据的结果为多行 cell。

get 'bigdata:student','1001'
get 'bigdata:student','1001' , {COLUMN => 'info:name'}


也可以修改读取 cell 的版本数,默认读取一个。最多能够读取当前列族设置的维护版本

数。

get 'bigdata:student','1001' , {COLUMN => 'info:name', VERSIONS => 6}

scan 是扫描数据,能够读取多行数据,不建议扫描过多的数据,推荐使用 startRow 和stopRow 来控制读取的数据,默认范围左闭右开。

scan 'bigdata:student',{STARTROW => '1001',STOPROW => '1002'}

实际开发中使用 shell 的机会不多,只做了解


3)删除数据

删除数据的方法有两个:delete 和 deleteall。

delete 表示删除一个版本的数据,即为 1 个 cell,不填写版本默认删除最新的一个版本。

delete 'bigdata:student','1001','info:name'

deleteall 表示删除所有版本的数据,即为当前行当前列的多个 cell。(执行命令会标记数据为要删除,不会直接将数据彻底删除,删除数据只在特定时期清理磁盘时进行)

#先写行,再写列
deleteall 'bigdata:student','1001','info:name'
相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
&nbsp; 相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情:&nbsp;https://cn.aliyun.com/product/hbase &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
分布式计算 Hadoop Shell
93 hbase安装
93 hbase安装
92 0
|
SQL 分布式计算 Hadoop
Hadoop集群hbase的安装
Hadoop集群hbase的安装
224 0
|
5月前
|
存储 Shell 分布式数据库
Hbase 的基本shell 命令
Hbase 的基本shell 命令
267 8
|
4月前
|
存储 Shell 分布式数据库
Hbase 的基本shell 命令
Hbase 的基本shell 命令
|
5月前
|
大数据 分布式数据库 Hbase
Hbase学习三:Hbase常用命令总结
Hbase学习三:Hbase常用命令总结
759 0
|
7月前
|
存储 Java Linux
Linux安装HBase的详细教程及常用方法
Linux安装HBase的详细教程及常用方法
751 1
|
7月前
|
SQL 分布式计算 Hadoop
Hadoop学习笔记(HDP)-Part.16 安装HBase
01 关于HDP 02 核心组件原理 03 资源规划 04 基础环境配置 05 Yum源配置 06 安装OracleJDK 07 安装MySQL 08 部署Ambari集群 09 安装OpenLDAP 10 创建集群 11 安装Kerberos 12 安装HDFS 13 安装Ranger 14 安装YARN+MR 15 安装HIVE 16 安装HBase 17 安装Spark2 18 安装Flink 19 安装Kafka 20 安装Flume
148 1
Hadoop学习笔记(HDP)-Part.16 安装HBase
|
7月前
|
Shell 分布式数据库 Apache
HBase 安装
HBase 安装
82 0
|
7月前
|
分布式数据库 Hbase
Hbase基础命令(2)
Hbase基础命令(2)
39 0
|
7月前
|
Java Shell 分布式数据库
Hbase基础命令
Hbase基础命令
142 0