HBase 详细API操作

本文涉及的产品
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
简介: HBase 详细API操作

使用Java API操作Hbase的方法:


1.Configuration


在使用Java API时,Client端需要知道HBase的配置环境,如存储地址,zookeeper等信息。这些信息通过Configuration对象来封装,可通过如下代码构建该对象


Configuration config=HBaseConfiguration.create();


在调用HBaseConfiguration.create()方法时,HBase首先会在classpath下查找hbase-site.xml文件,将里面的信息解析出来封装到Configuration对象中,如果hbase-site.xml文件不存在,则使用默认的hbase-core.xml文件。


除了将hbase-site.xml放到classpath下,开发人员还可通过config.set(name, value)方法来手工构建Configuration对象。


Configuration.set(String name, String value)

2.HBaseAdmin


HBaseAdmin用于创建数据库表格,并管理表格的元数据信息,通过如下方法构建


HBaseAdmin admin=new HBaseAdmin(config);


常用方法:


addColumn(tableName,column):为表格添加栏位


deleteColumn(tableName,column):删除指定栏位


balanceSwitch(boolean):是否启用负载均衡


createTable(HTableDescriptor desc):创建表格


deleteTable(tableName):删除表格


tableExists(tableName):判断表格是否存在


示例:创建test表格,并为其指定columnFamily为cf


HBaseAdmin admin=new HBaseAdmin(config);
If(!admin.tableExists(“test”)){
HTableDescriptor tableDesc=new HTableDescriptor(“test”);
HColumnDescriptor cf=new HColumnDescriptor(“cf”);
tableDesc.addFamily(cf);
admin.createTable(tableDesc);
}


3.HTable


在HBase中,HTable封装表格对象,对表格的增删改查操作主要通过它来完成,构造方法如下:


HTable table=new HTable(config,tableName);


在构建多个HTable对象时,HBase推荐所有的HTable使用同一个Configuration。这样,HTable之间便可共享HConnection对象、zookeeper信息以及Region地址的缓存信息。


示例1:Get操作


Get get=new Get(rowKey);
Result res=table.get(get);

示例2:Put操作


Put put=new Put(rowKey);
put.add(columnFamily,column,value);
table.put(put);

注:在HBase中,实体的新增和更新都是通过Put操作来实现。


示例3:Delete操作


Delete delete=new Delete();
table.delete(delete);

示例4:Scan操作


Scan scan=new Scan( );
scan.addColumn(columnFamily,column);//指定查询要返回的column
SingleColumnValueFilter filter=new SingleColumnValueFilter(
columnFamily,column,//指定要过滤的column
CompareOp.EQUAL,value//指定过滤条件
);

//更多的过滤器信息请查看org.apache.hadoop.hbase.filter包


scan.setFilter(filter);//为查询指定过滤器


ResultScanner scanner=table.getScanner(scan);//执行扫描查找


Iterator res=scanner.iterator( );//返回查询遍历器


HBase提供了java api来对HBase进行一系列的管理涉及到对表的管理、数据的操作等。常用的API操作有:


1、对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。


2、 插入数据


创建一个Put对象,在这个Put对象里可以指定要给哪个列增加数据,以及当前的时间戳等值,然后通过调用HTable.put(Put)来提交操作,子猴在这里提请注意的是:在创建Put对象的时候,你必须指定一个行(Row)值,在构造Put对象的时候作为参数传入。


3、 获取数据


要获取数据,使用Get对象,Get对象同Put对象一样有好几个构造函数,通常在构造的时候传入行值,表示取第几行的数据,通过HTable.get(Get)来调用。


4、浏览每一行


通过Scan可以对表中的行进行浏览,得到每一行的信息,比如列名,时间戳等,Scan相当于一个游标,通过next()来浏览下一个,通过调用HTable.getScanner(Scan)来返回一个ResultScanner对象。HTable.get(Get)和HTable.getScanner(Scan)都是返回一个Result。Result是一个


KeyValue的链表。


5、 删除


使用Delete来删除记录,通过调用HTable.delete(Delete)来执行删除操作。(注:删除这里有些特别,也就是删除并不是马上将数据从表中删除。)


6、锁


新增、获取、删除在操作过程中会对所操作的行加一个锁,而浏览却不会。


7、簇的访问


客户端代码通过ZooKeeper来访问找到簇,也就是说ZooKeeper quorum将被使用,那么相关的类(包)应该在客户端的类(classes)目录下,即客户端一定要找到文件hbase-site.xml。


环境准备


新建项目后在pom.xml中添加依赖:


<dependency>
    <groupId>org.apache.hbase</groupId>
    <artifactId>hbase-server</artifactId>
    <version>1.3.1</version>
</dependency>
<dependency>
    <groupId>org.apache.hbase</groupId>
    <artifactId>hbase-client</artifactId>
    <version>1.3.1</version>
</dependency>
<dependency>
  <groupId>jdk.tools</groupId>
  <artifactId>jdk.tools</artifactId>
  <version>1.8</version>
  <scope>system</scope>
  <systemPath>${JAVA_HOME}/lib/tools.jar</systemPath>
</dependency>


HBaseAPI


获取Configuration对象


public static Configuration configuration;
static{
  //使用HBaseConfiguration的单例方法实例化
  configuration = HBaseConfiguration.create();
    configuration.set("hbase.zookeeper.quorum", "192.168.9.102");
    configuration.set("hbase.zookeeper.property.clientPort", "2181");
}


判断表是否存在


public static boolean isTableExist(String tableName) throws MasterNotRunningException,
 ZooKeeperConnectionException, IOException{
  //在HBase中管理、访问表需要先创建HBaseAdmin对象
    //Connection connection = ConnectionFactory.createConnection(configuration);
    //HBaseAdmin admin = (HBaseAdmin) connection.getAdmin();
  HBaseAdmin admin = new HBaseAdmin(configuration);
  return admin.tableExists(tableName);
}


创建表


public static void createTable(String tableName, String... columnFamily) throws
 MasterNotRunningException, ZooKeeperConnectionException, IOException{
  HBaseAdmin admin = new HBaseAdmin(configuration);
  //判断表是否存在
  if(isTableExist(tableName)){
    System.out.println("表" + tableName + "已存在");
    //System.exit(0);
  }else{
    //创建表属性对象,表名需要转字节
    HTableDescriptor descriptor = new HTableDescriptor(TableName.valueOf(tableName));
    //创建多个列族
    for(String cf : columnFamily){
      descriptor.addFamily(new HColumnDescriptor(cf));
    }
    //根据对表的配置,创建表
    admin.createTable(descriptor);
    System.out.println("表" + tableName + "创建成功!");
  }
}


删除表


public static void dropTable(String tableName) throws MasterNotRunningException,
 ZooKeeperConnectionException, IOException{
  HBaseAdmin admin = new HBaseAdmin(conf);
  if(isTableExist(tableName)){
    admin.disableTable(tableName);
    admin.deleteTable(tableName);
    System.out.println("表" + tableName + "删除成功!");
  }else{
    System.out.println("表" + tableName + "不存在!");
  }
}


向表中put数据


public static void addRowData(String tableName, String rowKey, String columnFamily, String
 column, String value) throws IOException{
  //创建HTable对象
  HTable hTable = new HTable(configuration, tableName);
  //向表中插入数据
  Put put = new Put(Bytes.toBytes(rowKey));
  //向Put对象中组装数据
  put.add(Bytes.toBytes(columnFamily), Bytes.toBytes(column), Bytes.toBytes(value));
  hTable.put(put);
  hTable.close();
  System.out.println("插入数据成功");
}


删除多行数据


public static void deleteMultiRow(String tableName, String rows) throws IOException{
  HTable hTable = new HTable(conf, tableName);
  List<Delete> deleteList = new ArrayList<Delete>();
  for(String row : rows){
    Delete delete = new Delete(Bytes.toBytes(row));
    deleteList.add(delete);
  }
  hTable.delete(deleteList);
  hTable.close();
}


获取所有数据


public static void getAllRows(String tableName) throws IOException{
  HTable hTable = new HTable(configuration, tableName);
  //得到用于扫描region的对象
  Scan scan = new Scan();
  //使用HTable得到resultcanner实现类的对象
  ResultScanner resultScanner = hTable.getScanner(scan);
  for(Result result : resultScanner){
    Cell[] cells = result.rawCells();
    for(Cell cell : cells){
      //得到rowkey
      System.out.println("行键:" + Bytes.toString(CellUtil.cloneRow(cell)));
      //得到列族
      System.out.println("列族" + Bytes.toString(CellUtil.cloneFamily(cell)));
      System.out.println("列:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
      System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
    }
  }
}


获取某一行数据


public static void getRow(String tableName, String rowKey) throws IOException{
  HTable table = new HTable(conf, tableName);
  Get get = new Get(Bytes.toBytes(rowKey));
  //get.setMaxVersions();显示所有版本
    //get.setTimeStamp();显示指定时间戳的版本
  Result result = table.get(get);
  for(Cell cell : result.rawCells()){
    System.out.println("行键:" + Bytes.toString(result.getRow()));
    System.out.println("列族" + Bytes.toString(CellUtil.cloneFamily(cell)));
    System.out.println("列:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
    System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
    System.out.println("时间戳:" + cell.getTimestamp());
  }
}


获取某一行指定“列族:列”的数据


public static void getRowQualifier(String tableName, String rowKey, String family, String
 qualifier) throws IOException{
  HTable table = new HTable(configuration, tableName);
  Get get = new Get(Bytes.toBytes(rowKey));
  get.addColumn(Bytes.toBytes(family), Bytes.toBytes(qualifier));
  Result result = table.get(get);
  for(Cell cell : result.rawCells()){
    System.out.println("行键:" + Bytes.toString(result.getRow()));
    System.out.println("列族" + Bytes.toString(CellUtil.cloneFamily(cell)));
    System.out.println("列:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
    System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
  }
}
相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
&nbsp; 相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情:&nbsp;https://cn.aliyun.com/product/hbase &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
5月前
|
文字识别 小程序 安全
印刷文字识别操作报错合集之微信小程序调用API时路径总是返回不对,该如何处理
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
文字识别 前端开发 API
印刷文字识别操作报错合集之通过HTTPS连接到OCR服务的API时报错,该如何处理
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
DataWorks 关系型数据库 MySQL
DataWorks操作报错合集之调用CreateQualityRule API时,BlockType参数为0,会报错:"blockType less than minimum",该怎么办
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
5月前
|
DataWorks 数据管理 大数据
DataWorks操作报错合集之在连接HBase时出现超时问题,该怎么解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
5月前
|
前端开发 JavaScript API
惊天揭秘!AJAX与Fetch API如何让你的前后端交互秒变‘神级操作’!
【7月更文挑战第15天】在Web开发中,AJAX和Fetch API革新了前后端交互,告别了表单提交带来的页面刷新。AJAX利用XMLHttpRequest实现部分页面更新,开启无刷新时代;Fetch API作为现代替代,以其简洁和Promise支持简化异步操作。从AJAX的先驱地位到Fetch API的进化,两者提升了Web应用的性能和用户体验,成为现代开发的必备技能。
56 2
|
5月前
|
搜索推荐 API UED
资源部署及场景API调用体验过程的引导与操作流畅性
资源部署及场景API调用体验过程的引导与操作流畅性
|
5月前
|
XML JSON 文字识别
印刷文字识别操作报错合集之API调用过程中报错469,是什么导致的
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
运维 Devops API
阿里云云效操作报错合集之直接用API调用可以使用,但是本地用Go代码调用失败,是什么导致的?
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
5月前
|
运维 Kubernetes API
阿里云云效操作报错合集之API返回的错误信息,错误码为"Operate.NoPermission",该如何解决
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
5月前
|
运维 Devops API
阿里云云效操作报错合集之调用旧版API添加代码源时遇到500错误,是什么导致的
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。