杨校老师课堂之分布式数据库HBase的部署和基本操作

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
简介: 杨校老师课堂之分布式数据库HBase的部署和基本操作

部署分布式数据库——HBase

学习背景:

以下采用伪分布式方式搭建HBase

故而采用内置的Zookeeper协调处理,不再搭建外置ZooKeeper,因此会存在单点故障问题,若需要解决这个情况,可采用Zookeeper部署一个HA(高可用)的Habse集群解决。

(1) 安装JDK、Hadoop,这里采用的JDK1.8,Hadoop2.7.4,CentOS7.6

本次部署测试的ip地址设为:

192.168.6.166

运行Hadoop环境,测试是否正常通过,启动命令: start-dfs.sh

(2)下载HBase安装包。官网地址:https://archive.apache.org/dist/hbase 相关大数据框架下载整理

(3) 安装

  • 3.1 上传并完成解压HBase安装包
[root@hadoop1 ~]# tar -zxvf hbase-1.2.1-bin.tar.gz

(4) 准备配置文件

  • 4.1 拷贝配置文件
[root@hadoop1 ~]# cp /usr/local/hadoop/hadoop-2.7.4/etc//hadoop/{hdfs-site.xml,core-site.xml}  /usr/local/hbase/hbase-1.2.1/conf/
  • 4.2 修改配置文件hbase-env.sh
# 加入jdk的安装路径到JAVA_HOME
[root@hadoop1 ~]# vim hbase-env.sh 
  • 4.3 设置HBase的环境变量
[root@hadoop1 ~]# vim /etc/profile
#HBase environment variable
export HBASE_HOME=/usr/local/hbase/hbase-1.2.1
export PATH=$PATH:$HBASE_HOME/bin:

#更新配置文件profile生效
[root@hadoop1 ~]# source /etc/profile
# 查看hbase的版本
[root@hadoop1 ~]# hbase version

运行HBase数据库

[root@hadoop1 conf]# start-hbase.sh

运行成功后,已通过浏览器访问:http://hadoop1:16010/master-status

注意:

可以通过修改hosts来实现访问主机名进入web界面

具体路径:

C:\Windows\System32\drivers\etc\hosts

在hosts文件内的最后一行加入:

192.168.6.166 hadoop1

HBase的基本操作

方式一:HBase的Shell操作
#启动交互界面
[root@hadoop1 ~]# hbase shell
# 创建表
hbase(main):001:0> create 'student','info'
0 row(s) in 3.1630 seconds

=> Hbase::Table - student
# 查询表
hbase(main):002:0> list
TABLE                                                                                                                                                        
student                                                                                                                                                      
1 row(s) in 0.5240 seconds

=> ["student"]

  • 插入数据
# 插入数据
hbase(main):003:0> put 'student','1001','info:name','zhangsan'
0 row(s) in 3.0910 seconds

hbase(main):004:0> put 'student','1001','info:age','19'
0 row(s) in 0.1290 seconds

hbase(main):005:0> put 'student','1001','info:gender','male'
0 row(s) in 0.2760 seconds

hbase(main):006:0> put 'student','1002','info:name','lisi'
0 row(s) in 0.0090 seconds

hbase(main):007:0> put 'student','1002','info:age','21'
0 row(s) in 0.0800 seconds

hbase(main):008:0> put 'student','1002','info:gender','female'
0 row(s) in 0.0150 seconds
  • 扫描数据
hbase(main):009:0> scan 'student'
 ROW                    COLUMN+CELL                                                                                                         
 1001                   column=info:age, timestamp=1650086163620, value=19                                                                  
 1001                   column=info:gender, timestamp=1650086205652, value=male                                                             
 1001                   column=info:name, timestamp=1650085979553, value=zhangsan                                                           
 1002                   column=info:age, timestamp=1650086249277, value=21                                                                  
 1002                   column=info:gender, timestamp=1650086265874, value=female                                                           
 1002                   column=info:name, timestamp=1650086227559, value=lisi                                                               
2 row(s) in 0.1450 seconds
  • 查看表结构
hbase(main):010:0> describe 'student'
Table student is ENABLED                                                                                                                                     
student                                                                                                                                                      
COLUMN FAMILIES DESCRIPTION                                                                                                                                  
{NAME => 'info', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER',
 COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'}                                           
1 row(s) in 0.2190 seconds

  • 更新语句
hbase(main):011:0> put 'student','1002','info:age','22'
0 row(s) in 0.1000 seconds

# 修改后查询验证是否修改成功
hbase(main):016:0> scan 'student'
 ROW                      COLUMN+CELL                                                                                                         
 1001                     column=info:age, timestamp=1650086163620, value=19                                                                  
 1001                     column=info:gender, timestamp=1650086205652, value=male                                                             
 1001                     column=info:name, timestamp=1650085979553, value=zhangsan                                                           
 1002                     column=info:age, timestamp=1650086635741, value=22                                                                  
 1002                     column=info:gender, timestamp=1650086265874, value=female                                                           
 1002                     column=info:name, timestamp=1650086227559, value=lisi                                                               
2 row(s) in 0.0330 seconds

  • 获取指定字段的操作
hbase(main):002:0> get 'student','1001'
 COLUMN                                  CELL                                                                                                                
 info:age                                timestamp=1650086163620, value=19                                                                                   
 info:gender                             timestamp=1650086205652, value=male                                                                                 
 info:name                               timestamp=1650085979553, value=zhangsan                                                                             
3 row(s) in 0.0420 seconds

  • 删除语句
hbase(main):008:0> delete 'student','1002','info:gender'
0 row(s) in 0.0900 seconds

# 删除后查询验证是否修改成功
hbase(main):009:0> scan 'student'
 ROW                         COLUMN+CELL                                                                                                         
 1001                        column=info:age, timestamp=1650086163620, value=19                                                                  
 1001                        column=info:gender, timestamp=1650086205652, value=male                                                             
 1001                        column=info:name, timestamp=1650085979553, value=zhangsan                                                           
 1002                        column=info:age, timestamp=1650086635741, value=22                                                                  
 1002                        column=info:name, timestamp=1650086227559, value=lisi                                                               
2 row(s) in 0.0530 seconds

方式二: 利用Java API操作HBase
  • 1.创建Maven项目
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>cn.javabs</groupId>
    <artifactId>JAVA_HBASE</artifactId>
    <version>1.0-SNAPSHOT</version>

    <dependencies>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-common</artifactId>
            <version>1.2.6</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>1.2.6</version>
        </dependency>
    </dependencies>


</project>
  1. 导入坐标,并完成类的创建

  2. 编写代码
package cn.javabs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.Before;
import org.junit.Test;

import java.io.IOException;
import java.util.List;


public class HBaseTest {

    Configuration conf  = null;
    Connection conn = null;
    @Before
    public void  init() throws IOException {
        // 1. 获取配置对象conf
        conf  = HBaseConfiguration.create();
        // 2. 通过配置对象conf 设置hbase的入口
//        conf.set("hbase.rootdir","hdfs://hadoop1:9000/hbase");
        conf.set("hbase.zookeeper.quorum","hadoop1:2181");/*采用内置的zookeeper*/
        //  3. 获取连接,利用连接工厂进行创建连接,借助配置对象conf
        conn = ConnectionFactory.createConnection(conf);
    }

    /**
     * 创建表
     * @throws IOException
     */
    @Test
    public void  createTable() throws IOException {
      // 1. 通过conn获取表的管理对象
        Admin admin = conn.getAdmin();
        long beginTime = System.currentTimeMillis();
        // 2. 创建表的描述符对象,并且完成指定的表名:t_user
        HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf("teacher".getBytes()));
        // 3. 创建列族、并赋值为info
        HColumnDescriptor hcd = new HColumnDescriptor("data");
        // 将列族添加到 表描述符对象
        tableDescriptor.addFamily(hcd);
        // 利用表管理器对象 来创建表
        admin.createTable(tableDescriptor);
        long endime = System.currentTimeMillis();
        System.out.println("创建完成,结束了!" +( endime -  beginTime) + "毫秒");

        // 关闭资源
        admin.close();
        conn.close();
    }

    /**
     * 指定查询
     * @throws IOException
     */
    @Test
    public void  getData() throws IOException{
        Table table = conn.getTable(TableName.valueOf("student"));
        // 1. 创建get对象是 查询参数的对象  用于指定要查询的哪一行
        Get get = new Get("1002".getBytes());
        // 2. 返回查询结果的数据
        Result result = table.get(get);
        // 3. 获取结果中所有的cell
        List<Cell> cellList = result.listCells();
        // 4. 循环遍历 所以的cell
        for(Cell c : cellList){
            // 5. 获取打印行健
            System.out.println("行:" + Bytes.toString(CellUtil.cloneRow(c)));
            // 6. 获取打印列族
            System.out.println("列族:" + Bytes.toString(CellUtil.cloneFamily(c)));
            // 7. 获取打印值
            System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(c)));
        }
        // 8. 关闭资源
        table.close();
        conn.close();


    }
}


相关实践学习
云数据库HBase版使用教程
&nbsp; 相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情:&nbsp;https://cn.aliyun.com/product/hbase &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
2月前
|
SQL 关系型数据库 数据库
【YashanDB知识库】OM仲裁节点故障后手工切换方案和yasom仲裁重新部署后重新纳管数据库集群方案
本文介绍了主备数据库集群的部署、OM仲裁故障切换及重新纳管的全过程。首先通过解压软件包并调整安装参数完成数据库集群部署,接着说明了在OM仲裁故障时的手动切换方案,包括关闭自动切换开关、登录备节点执行切换命令。最后详细描述了搭建新的yasom仲裁节点以重新纳管数据库集群的步骤,如生成配置文件、初始化进程、执行托管命令等,确保新旧系统无缝衔接,保障数据服务稳定性。
|
2月前
|
数据库
【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
|
29天前
|
SQL 存储 分布式数据库
分布式存储数据恢复—hbase和hive数据库数据恢复案例
分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。 分布式存储故障: 数据库底层文件被误删除,数据库不能使用。要求恢复hbase和hive数据库。
75 12
|
6月前
|
存储 监控 安全
数据库多实例的部署与配置方法
【10月更文挑战第23天】数据库多实例的部署和配置需要综合考虑多个因素,包括硬件资源、软件设置、性能优化、安全保障等。通过合理的部署和配置,可以充分发挥多实例的优势,提高数据库系统的运行效率和可靠性。在实际操作中,要不断总结经验,根据实际情况进行调整和优化,以适应不断变化的业务需求。
|
2月前
|
SQL 关系型数据库 网络安全
Navicat Premium 17 最新版下载与配置:5分钟完成企业级数据库工具部署
Navicat Premium 17 是一款支持多种主流数据库(如 MySQL、Oracle、PostgreSQL 等)的多数据库管理工具,提供可视化数据建模、SQL 编辑和数据同步等功能。试用版提供 14 天全功能体验,商业版支持跨平台使用。安装环境要求 Windows 10/11 或 macOS 12.0+,最低配置为 4GB 内存。下载并解压安装包后,按步骤启动安装程序、接受许可协议、自定义安装路径并完成安装。首次运行时需激活许可证并配置数据库连接。常见问题包括无法写入注册表、试用期续费及连接数据库权限问题。高级功能涵盖 SSH 通道加速、自动化任务调度和性能调优建议。
395 19
|
3月前
|
中间件 关系型数据库 数据库
docker快速部署OS web中间件 数据库 编程应用
通过Docker,可以轻松地部署操作系统、Web中间件、数据库和编程应用。本文详细介绍了使用Docker部署这些组件的基本步骤和命令,展示了如何通过Docker Compose编排多容器应用。希望本文能帮助开发者更高效地使用Docker进行应用部署和管理。
94 19
|
3月前
|
数据库
【YashanDB 知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
**数据库主备切换简介** 在数据库正常或异常情况下,实现主备切换至关重要。若配置不当,主节点故障将影响业务使用,尤其在23.2版本中。原因包括资源紧张或主节点异常。解决方法涵盖手动和自动切换: 1. **一主一备部署**: - **手动切换**:支持Switchover(同步正常时)和Failover(主库损坏时)。 - **自动切换**:启用yasom仲裁选主开关。 2. **一主两备部署**: - 默认最大保护模式,自动切换开启。 需检查并配置自动切换以确保高可用性。经验总结:一主一备默认关闭自动切换,需手动开启;一主两备默认开启。
|
4月前
|
JavaScript NoSQL Java
基于SpringBoot+Vue实现的大学生就业服务平台设计与实现(系统源码+文档+数据库+部署等)
面向大学生毕业选题、开题、任务书、程序设计开发、论文辅导提供一站式服务。主要服务:程序设计开发、代码修改、成品部署、支持定制、论文辅导,助力毕设!
|
4月前
|
JavaScript NoSQL Java
基于SpringBoot+Vue的班级综合测评管理系统设计与实现(系统源码+文档+数据库+部署等)
✌免费选题、功能需求设计、任务书、开题报告、中期检查、程序功能实现、论文辅导、论文降重、答辩PPT辅导、会议视频一对一讲解代码等✌
|
3月前
|
SQL 关系型数据库 数据库
【YashanDB 知识库】OM 仲裁节点故障后手工切换方案和 yasom 仲裁重新部署后重新纳管数据库集群方案
本文介绍了一主一备数据库集群的部署步骤。首先在OM节点上传并解压软件包至指定路径,随后通过调整安装参数、执行安装和集群部署完成数据库设置。接着,在主备节点分别配置环境变量,并查看数据库状态以确认安装成功。最后,针对OM仲裁故障提供了手动切换方案,包括构造故障场景、关闭自动切换开关及使用SQL命令进行主备切换,确保系统高可用性。

热门文章

最新文章