【HBase】(7)-HBase常用API

简介: 【HBase】(7)-HBase常用API

简 介:HBase是谷歌BigData论文的一个代码实现,在大数据处理领域应用广泛。本文意在记录自己近期学习过程中的所学所得,如有错误,欢迎大家指正。

 

关键词:大数据组件、HBase、NoSQL

一、HBase API学习

(一)、DDL操作

1.导入HBase依赖

<dependencies>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-server</artifactId>
            <version>1.3.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>1.3.1</version>
        </dependency>
</dependencies>

2.获取Configuration对象

这是过时的方式,现在使用工厂模式进行创建连接,但是不影响使用。

Configuration conf = HBaseConfiguration.create();
# 配置zookeeper集群,端口可以不用配置,默认就是2181
conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop103");

3.判断表是否存在

首先需要获取一个配置类对象,用于配置HBase集群相关的属性,然后新的方式需要创建一个Connection对象,但是Connection是一个接口,不能够直接创建,需要用工厂类进行创造一个Connection对象,然后利用该对象获取客户端对象Admin。

创建相关配置

Configuration conf = null;
Connection connection = null;
Admin admin = null;
@Before
public void init() throws Exception {
    conf = HBaseConfiguration.create();
    conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop104");
    connection = ConnectionFactory.createConnection(conf);
    admin = connection.getAdmin();
}

代码

@Test
public void isExistTable() throws IOException {
    String tableName="stu";
    boolean result = admin.tableExists(TableName.valueOf(tableName));
    System.out.println(result);
}

关闭资源

@After
public void close() throws Exception {
    if (admin != null) {
        admin.close();
    }
    if (connection != null) {
        connection.close();
    }
}

这里注意一下,我们要操纵HBase进行DML操作,那么就需要一个客户端对象,new对象的同时需要传入一个配置对象,配置集群,而且当我们使用完客户端对象的时候记得close一下

进行代码测试一下:

4.创建一张新表

使用JavaAPI创建一张新表的流程为:

  1. 获取一个表的描述器
  2. 遍历列族,为每个列族创建一个列的描述器
  3. 将每个描述器添加到表的描述器中
  4. 使用客户端对象进行创建表
public static void createTable(String tableName, String... cfs) throws IOException {
        //判断列族是否为0
        if (cfs.length <= 0) {
            System.out.println("列族为0");
            return;
        }
        //判断表是否存在
        if (isExistTable(tableName)) {
            System.out.println("当前表已经存在");
            return;
        }
        //创建一个表的描述器
        HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));
        //创建列族
        for (String cf : cfs) {
            HColumnDescriptor columnDescriptor = new HColumnDescriptor(cf);
            tableDescriptor.addFamily(columnDescriptor);
        }
        //创建新表
        admin.createTable(tableDescriptor);
        System.out.println("创建成功");
    }

5.删除表

我们注意一下,HBase不同于mysql这些,当我们删除一张表时,需要将这张表进行下线,然后再将其删除。

public static void deleteTable(String tableName) throws IOException {
        if (!isExistTable(tableName)) {
            System.out.println("表不存在");
            return;
        }
      //将表进行下线
        admin.disableTable(TableName.valueOf(tableName));
      //删除表
        admin.deleteTable(TableName.valueOf(tableName));
        System.out.println("删除成功");
    }

6.创建命名空间

创建命名空间同样也需要创建一个描述器,然后用admin对象进行创建一个命名空间。

public static void createNameSpace(String nameSpace) throws IOException {
        NamespaceDescriptor namespaceDescriptor = NamespaceDescriptor.create(nameSpace).build();
        admin.createNamespace(namespaceDescriptor);
        System.out.println("创建成功");
    }

(二)、DML操作

1.向表中插入数据

插入数据的流程为:

  1. 使用connection对象与表进行连接,获取表对象
  2. new一个put对象,对应一个rowKey
  3. 向put对象进行插入每列的值
  4. 将put对象放到表中
public static void insertData(String tableName, String rowKey, String cf, String cn, String value) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));
        Put put = new Put(Bytes.toBytes(rowKey));
        put.addColumn(Bytes.toBytes(cf), Bytes.toBytes(cn), Bytes.toBytes(value));
        table.put(put);
        table.close();
    }

上面注意使用完表之后要将其进行关闭。

2.读取表中数据(通过get对象,rowKey)

读取数据流程:

  1. 创建表连接
  2. 获得get对象
  3. 通过rowKey拿到所有rowKey对应的结果
  4. 遍历结果集中的Cell
public static void getData(String tableName, String rowKey, String cf, String cn) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));
        Get get = new Get(Bytes.toBytes(rowKey));
        Result result = table.get(get);
        for (Cell cell : result.rawCells()) {
            System.out.println("列族:" + Bytes.toString(CellUtil.cloneFamily(cell)));
            System.out.println("列名:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
            System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
        }
        table.close();
    }

3.获取数据通过Scan扫描器

我们如果范围取值,或者扫描全表就需要使用Scan扫描器。

table.getScanner(scan)获得的是一个结果集,其实这里可以不是迭代器,result可以迭代是因为HBase是存储大数据的,而且进行扫描全表的时候出来的数据会较多,所以将数据分成几个结果,每个结果再进行cell迭代。

public static void scanData(String tableName, String rowKey, String cf, String cn) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));
        Scan scan = new Scan();
        ResultScanner results = table.getScanner(scan);
        for (Result result : results) {
            for (Cell cell : result.rawCells()) {
                System.out.println("列族:" + Bytes.toString(CellUtil.cloneFamily(cell)));
                System.out.println("列名:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
                System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
            }
        }
        table.close();
    }


相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
&nbsp; 相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情:&nbsp;https://cn.aliyun.com/product/hbase &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
4月前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
134 0
|
存储 分布式计算 Hadoop
分布式数据库HBase的常用操作的对应的API编程接口
HBase是一个分布式数据库系统,基于Google的BigTable和Apache Hadoop的HDFS构建。它提供了一个高性能、可扩展的数据库平台,适用于大规模的数据存储和处理。在阿里云开发者社区中,很多开发者都会使用HBase进行数据存储和处理。本文将介绍HBase的常用操作及其对应的API编程接口。
265 0
|
3月前
|
Java 大数据 API
【大数据】HDFS、HBase操作教程(含指令和JAVA API)
【大数据】HDFS、HBase操作教程(含指令和JAVA API)
105 0
【大数据】HDFS、HBase操作教程(含指令和JAVA API)
|
4月前
|
Java 分布式数据库 API
HBase java API
HBase java API
41 0
|
4月前
|
存储 NoSQL 分布式数据库
分布式NoSQL列存储数据库Hbase Java API(四)
分布式NoSQL列存储数据库Hbase Java API(四)
51 0
|
4月前
|
存储 NoSQL 分布式数据库
分布式NoSQL列存储数据库Hbase Java API(三)
分布式NoSQL列存储数据库Hbase Java API(三)
51 0
|
4月前
|
Java 分布式数据库 API
|
存储 Java 分布式数据库
HBase基础编程——HBase Java API编程
HBase基础编程——HBase Java API编程
HBase基础编程——HBase Java API编程
|
SQL 分布式数据库 Hbase
|
存储 Java API
HBase Java API详解
【本文转自HBase Java API详解】 HBase是Hadoop的数据库,能够对大数据提供随机、实时读写访问。他是开源的,分布式的,多版本的,面向列的,存储模型。 在讲解的时候我首先给大家讲解一下HBase的整体结构,如下图: HBase Master是服务器负责管理所有的HRegion服务器,HBase Master并不存储HBase服务器的任何数据,
2467 0