Hbase常用shell操作

简介: Hbase常用shell操作

1 需求

我们可以以shell的方式来维护和管理HBase。例如:执行建表语句、执行增删改查操作等等。

有以下订单数据,我们想要将这样的一些数据保存到HBase中。

接下来,我们将使用HBase shell来进行以下操作:

  1. 创建表
  2. 添加数据
  3. 更新数据
  4. 删除数据
  5. 查询数据

2 创建表

在HBase中,所有的数据也都是保存在表中的。要将订单数据保存到HBase中,首先需要将表创建

出来。

2.1 启动HBase Shell

HBase的shell其实JRuby的IRB(交互式的Ruby),但在其中添加了一些HBase的命令。

启动HBase shell:

hbase shell

2.2 创建表

语法:

create ‘表名’,‘列蔟名’…

创建订单表,表名为ORDER_INFO,该表有一个列蔟为C1

create ‘ORDER_INFO’,‘C1’;

注意:

⚫ create要写成小写

⚫ 一个表可以包含若干个列蔟

⚫ 命令解析:调用 hbase提供的ruby脚本的create方法,传递两个字符串参数

⚫ 通过下面链接可以看到每个命令都是一个ruby脚本

https://github.com/apache/hbase/tree/branch-2.1/hbase-shell/src/main/ruby/shell/comm

ands

2.3 查看表

hbase(main):005:0> list
TABLE
ORDER_INFO
1 row(s)
Took 0.0378 seconds
=> ["ORDER_INFO"]

2.4 删除表

要删除某个表,必须要先禁用表

2.4.1 禁用表

语法:disable “表名”

2.4.2 删除表

语法:drop “表名”

2.4.3 删除ORDER_INFO表

disable "ORDER_INFO"

drop "ORDER_INFO"

3 添加数据

3.1 需求

接下来,我们需要往订单表中添加以下数据。

3.2 PUT操作

HBase中的put命令,可以用来将数据保存到表中。但put一次只能保存一个列的值。以下是put的

语法结构:

put ‘表名’,‘ROWKEY’,‘列蔟名:列名’,‘值’

要添加以上的数据,需要使用7次put操作。如下:

put 'ORDER_INFO','000001','C1:ID','000001'
put 'ORDER_INFO','000001','C1:STATUS','已提交'
put 'ORDER_INFO','000001','C1:PAY_MONEY',4070
put 'ORDER_INFO','000001','C1:PAYWAY',1
put 'ORDER_INFO','000001','C1:USER_ID',4944191
put 'ORDER_INFO','000001','C1:OPERATION_DATE','2020-04-25 12:09:16'
put 'ORDER_INFO','000001','C1:CATEGORY','手机;'

4 查看添加的数据

4.1 需求

要求将rowkey为:000001对应的数据查询出来。

4.2 get命令

在HBase中,可以使用get命令来获取单独的一行数据。语法:get '表名','rowkey'

4.3 查询指定订单ID的数据

get 'ORDER_INFO','000001'

4.4 显示中文

在HBase shell中,如果在数据中出现了一些中文,默认HBase shell中显示出来的是十六进制编码

要想将这些编码显示为中文,我们需要在get命令后添加一个属性:{FORMATTER => 'toString'}

4.4.1 查看订单的数据

get 'ORDER_INFO','000001', {FORMATTER => 'toString'}

注:

⚫ { key => value},这个是Ruby语法,表示定义一个HASH结构

⚫ get是一个HBase Ruby方法,’ORDER_INFO’、’000001’、{FORMATTER => ‘toString’}是put

方法的三个参数

⚫ FORMATTER要使用大写

⚫ 在Ruby中用{}表示一个字典,类似于hashtable,FORMATTER表示key、’toString’表示值

5 更新操作

5.1 需求

将订单ID为000001的状态,更改为「已付款」

5.2 使用put来更新数据

同样,在HBase中,也是使用put命令来进行数据的更新,语法与之前的添加数据一模一样。

5.3 更新指定的列

put 'ORDER_INFO', '000001', 'C1:STATUS', '已付款'

注意:

⚫ HBase中会自动维护数据的版本

⚫ 每当执行一次put后,都会重新生成新的时间戳

C1:STATUS timestamp=1588748844082, value=已提交
C1:STATUS timestamp=1588748952074, value=已付款
C1:STATUS timestamp=1588748994244, value=已付款

6 删除操作

6.1 删除状态列数据

6.1.1 需求

将订单ID为000001的状态列删除。

6.1.2 delete命令

在HBase中,可以使用delete命令来将一个单元格的数据删除。语法格式如下:

delete '表名', 'rowkey', '列蔟:列'。

注意:此处HBase默认会保存多个时间戳的版本数据,所以这里的delete删除的是最新版本的列数据。

6.1.3 删除指定的列

delete ‘ORDER_INFO’,‘000001’,‘C1:STATUS’

6.2 删除整行数据

6.2.1 需求

将订单ID为000001的信息全部删除(删除所有的列)

6.2.2 deleteall命令

deleteall命令可以将指定rowkey对应的所有列全部删除。语法:

deleteall '表名','rowkey'

6.2.3 删除指定的订单

deleteall ‘ORDER_INFO’,‘000001’

6.3 清空表

6.3.1 需求

将ORDER_INFO的数据全部删除

6.3.2 truncate命令

truncate命令用来清空某个表中的所有数据。语法:

truncate "表名"

6.3.3 清空ORDER_INFO的所有数据

truncate 'ORDER_INFO'

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
12天前
|
存储 算法 Shell
【Shell 命令集合 磁盘维护 】Linux 对软盘进行格式化操作 fdformat命令使用指南
【Shell 命令集合 磁盘维护 】Linux 对软盘进行格式化操作 fdformat命令使用指南
39 0
|
12天前
|
Shell Linux C语言
【Shell 命令集合 磁盘管理 】Linux 控制光驱或可移动媒体设备的弹出和关闭操作 eject命令使用教程
【Shell 命令集合 磁盘管理 】Linux 控制光驱或可移动媒体设备的弹出和关闭操作 eject命令使用教程
43 1
|
12天前
|
分布式计算 资源调度 Hadoop
HBase表数据的读、写操作与综合操作
HBase表数据的读、写操作与综合操作
50 0
|
12天前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
95 0
|
12天前
|
分布式计算 Hadoop Shell
熟悉常用的HBase操作
熟悉常用的HBase操作
44 3
熟悉常用的HBase操作
|
12天前
|
分布式计算 Hadoop Shell
|
8天前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版操作报错合集之使用 Event Time Temporal Join 关联多个 HBase 后,Kafka 数据的某个字段变为 null 是什么原因导致的
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
27 0
|
8天前
|
SQL 消息中间件 Kafka
实时计算 Flink版操作报错合集之使用 Event Time Temporal Join 关联多个 HBase 后,Kafka 数据的某个字段变为 null 是什么原因导致的
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
24 0
|
12天前
|
监控 Linux Shell
【Linux技术专题】「夯实基本功系列」带你一同学习和实践操作Linux服务器必学的Shell指令(排查问题指令 - 下)
在线上排查问题时,查询日志、查看系统配置和分析操作系统信息是至关重要的。这些操作可以帮助我们深入了解软件和服务的兼容性,并解决潜在的问题。在本次学习中,我们将介绍并深入学习一些我在处理类似问题时常用的指令。通过掌握这些指令,你将能够更加高效地定位和解决线上问题,提高系统的稳定性和性能。让我们一同进入这个学习过程吧!
50 0
【Linux技术专题】「夯实基本功系列」带你一同学习和实践操作Linux服务器必学的Shell指令(排查问题指令 - 下)
|
12天前
|
人工智能 机器人 Shell
【shell】shell数组的操作(定义、索引、长度、获取、删除、修改、拼接)
【shell】shell数组的操作(定义、索引、长度、获取、删除、修改、拼接)