【HBase】(7)-HBase常用API

2023-01-18 168

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【HBase】(7)-HBase常用API

简介：HBase是谷歌BigData论文的一个代码实现，在大数据处理领域应用广泛。本文意在记录自己近期学习过程中的所学所得，如有错误，欢迎大家指正。

关键词：大数据组件、HBase、NoSQL

一、HBase API学习

（一）、DDL操作

1.导入HBase依赖

<dependencies>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-server</artifactId>
            <version>1.3.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>1.3.1</version>
        </dependency>
</dependencies>

2.获取Configuration对象

这是过时的方式，现在使用工厂模式进行创建连接，但是不影响使用。

Configuration conf = HBaseConfiguration.create();
# 配置zookeeper集群，端口可以不用配置，默认就是2181
conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop103");

3.判断表是否存在

首先需要获取一个配置类对象，用于配置HBase集群相关的属性，然后新的方式需要创建一个Connection对象，但是Connection是一个接口，不能够直接创建，需要用工厂类进行创造一个Connection对象，然后利用该对象获取客户端对象Admin。

创建相关配置

Configuration conf = null;
Connection connection = null;
Admin admin = null;
@Before
public void init() throws Exception {
    conf = HBaseConfiguration.create();
    conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop104");
    connection = ConnectionFactory.createConnection(conf);
    admin = connection.getAdmin();
}

代码

@Test
public void isExistTable() throws IOException {
    String tableName="stu";
    boolean result = admin.tableExists(TableName.valueOf(tableName));
    System.out.println(result);
}

关闭资源

@After
public void close() throws Exception {
    if (admin != null) {
        admin.close();
    }
    if (connection != null) {
        connection.close();
    }
}

这里注意一下，我们要操纵HBase进行DML操作，那么就需要一个客户端对象，new对象的同时需要传入一个配置对象，配置集群，而且当我们使用完客户端对象的时候记得close一下

进行代码测试一下：

4.创建一张新表

使用JavaAPI创建一张新表的流程为：

获取一个表的描述器
遍历列族，为每个列族创建一个列的描述器
将每个描述器添加到表的描述器中
使用客户端对象进行创建表

public static void createTable(String tableName, String... cfs) throws IOException {
        //判断列族是否为0
        if (cfs.length <= 0) {
            System.out.println("列族为0");
            return;
        }
        //判断表是否存在
        if (isExistTable(tableName)) {
            System.out.println("当前表已经存在");
            return;
        }
        //创建一个表的描述器
        HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));
        //创建列族
        for (String cf : cfs) {
            HColumnDescriptor columnDescriptor = new HColumnDescriptor(cf);
            tableDescriptor.addFamily(columnDescriptor);
        }
        //创建新表
        admin.createTable(tableDescriptor);
        System.out.println("创建成功");
    }

5.删除表

我们注意一下，HBase不同于mysql这些，当我们删除一张表时，需要将这张表进行下线，然后再将其删除。

public static void deleteTable(String tableName) throws IOException {
        if (!isExistTable(tableName)) {
            System.out.println("表不存在");
            return;
        }
      //将表进行下线
        admin.disableTable(TableName.valueOf(tableName));
      //删除表
        admin.deleteTable(TableName.valueOf(tableName));
        System.out.println("删除成功");
    }

6.创建命名空间

创建命名空间同样也需要创建一个描述器，然后用admin对象进行创建一个命名空间。

public static void createNameSpace(String nameSpace) throws IOException {
        NamespaceDescriptor namespaceDescriptor = NamespaceDescriptor.create(nameSpace).build();
        admin.createNamespace(namespaceDescriptor);
        System.out.println("创建成功");
    }

（二）、DML操作

1.向表中插入数据

插入数据的流程为：

使用connection对象与表进行连接，获取表对象
new一个put对象，对应一个rowKey
向put对象进行插入每列的值
将put对象放到表中

public static void insertData(String tableName, String rowKey, String cf, String cn, String value) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));
        Put put = new Put(Bytes.toBytes(rowKey));
        put.addColumn(Bytes.toBytes(cf), Bytes.toBytes(cn), Bytes.toBytes(value));
        table.put(put);
        table.close();
    }

上面注意使用完表之后要将其进行关闭。

2.读取表中数据（通过get对象，rowKey）

读取数据流程：

创建表连接
获得get对象
通过rowKey拿到所有rowKey对应的结果
遍历结果集中的Cell

public static void getData(String tableName, String rowKey, String cf, String cn) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));
        Get get = new Get(Bytes.toBytes(rowKey));
        Result result = table.get(get);
        for (Cell cell : result.rawCells()) {
            System.out.println("列族：" + Bytes.toString(CellUtil.cloneFamily(cell)));
            System.out.println("列名：" + Bytes.toString(CellUtil.cloneQualifier(cell)));
            System.out.println("值：" + Bytes.toString(CellUtil.cloneValue(cell)));
        }
        table.close();
    }

3.获取数据通过Scan扫描器

我们如果范围取值，或者扫描全表就需要使用Scan扫描器。

table.getScanner(scan)获得的是一个结果集，其实这里可以不是迭代器，result可以迭代是因为HBase是存储大数据的，而且进行扫描全表的时候出来的数据会较多，所以将数据分成几个结果，每个结果再进行cell迭代。

public static void scanData(String tableName, String rowKey, String cf, String cn) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));
        Scan scan = new Scan();
        ResultScanner results = table.getScanner(scan);
        for (Result result : results) {
            for (Cell cell : result.rawCells()) {
                System.out.println("列族：" + Bytes.toString(CellUtil.cloneFamily(cell)));
                System.out.println("列名：" + Bytes.toString(CellUtil.cloneQualifier(cell)));
                System.out.println("值：" + Bytes.toString(CellUtil.cloneValue(cell)));
            }
        }
        table.close();
    }

【HBase】(7)-HBase常用API

一、HBase API学习

（一）、DDL操作

1.导入HBase依赖

2.获取Configuration对象

3.判断表是否存在

4.创建一张新表

5.删除表

6.创建命名空间

（二）、DML操作

1.向表中插入数据

2.读取表中数据（通过get对象，rowKey）

3.获取数据通过Scan扫描器

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【HBase】(7)-HBase常用API

一、HBase API学习

（一）、DDL操作

1.导入HBase依赖

2.获取Configuration对象

3.判断表是否存在

4.创建一张新表

5.删除表

6.创建命名空间

（二）、DML操作

1.向表中插入数据

2.读取表中数据（通过get对象，rowKey）

3.获取数据通过Scan扫描器

热门文章

最新文章

相关课程

相关电子书

相关实验场景