备案控制台

开发者社区问答正文

Hbase 统计表行数的3种方式

转载自：http://www.hbase.group/article/41

有些时候需要我们去统计某一个hbase表的行数，由于hbase本身不支持SQL语言，只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作：

1.count命令

最直接的方式是在hbase shell中执行count的命令可以统计行数。 hbase> count ‘t1′ hbase> count ‘t1′, INTERVAL => 100000 hbase> count ‘t1′, CACHE => 1000 hbase> count ‘t1′, INTERVAL => 10, CACHE => 1000

其中，INTERVAL为统计的行数间隔，默认为1000，CACHE为统计的数据缓存。这种方式效率很低，如果表行数很大的话不建议采用这种方式。 2. 调用Mapreduce


$HBASE_HOME/bin/hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'tablename'

这种方式效率比上一种要高很多，调用的hbase jar中自带的统计行数的类。 3.hive over hbase 如果已经见了hive和hbase的关联表的话，可以直接在hive中执行sql语句统计hbase表的行数。 hive over hbase 表的建表语句为：

展开

收起

pandacats 2019-12-20 21:16:20 2138 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

在Hive中创建与HBase关联的表时，通常会使用Hive的HBase存储处理器(HBaseStorageHandler)，这样可以直接通过Hive SQL查询HBase中的数据。建表语句示例如下：

CREATE TABLE hbase_table_hive (
  row_key string,
  column1 string,
  column2 string
) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
  "hbase.columns.mapping" = ":key,family1:column1,family1:column2"
)
TBLPROPERTIES ("hbase.table.name" = "t1");

在这个例子中： - hbase_table_hive 是你在Hive中创建的表名。 - row_key, column1, column2 分别对应HBase表中的列和列族结构。 - "hbase.columns.mapping" 属性指定了Hive表字段与HBase列族、列的映射关系，其中:key代表Row Key，family1:column1和family1:column2分别代表HBase中列族family1下的column1和column2列。 - "hbase.table.name" 属性指定了这个Hive表关联的HBase表名，这里是t1。

统计行数的Hive SQL命令很简单：

SELECT COUNT(*) FROM hbase_table_hive;

这条命令将直接返回HBase表t1通过Hive访问到的行数。这种方式相比直接使用HBase shell的count命令效率更高，特别是在处理大规模数据集时，因为Hive能够利用MapReduce或Tez等执行框架进行并行计算。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

SQL 缓存分布式计算 Java Shell 分布式数据库 HIVE Hbase 云数据库HBase版

问答标签：

云数据库HBase版行数

问答地址：

开发者社区 > 数据库 > 问答

相关问答

HBase Shell中使用LIMIT 返回的行数的语法及示例是什么？

955

1

0

请教一个问题。我在用spark读取hbase数据时，默认是一个regoin一个task。发现有些re

1238

0

0

odps导出数据到hbase,这个报错是什么意思啊？

824

1

0

hbase 表获取一行表数据如何用代码描述呢？

1737

1

0

删除hbase 表中多行数据如何用代码描述呢？

1956

1

0

删除 hbase 表中一行数据如何用代码描述呢？

1977

1

0

hbase表中添加数据如何用代码描述呢？

1648

1

0

HBase中怎样获取一行数据？表禁用后如何重新启动？

1899

1

0

HBase中列有什么组成？获取数据有什么方法？

1454

1

0

dataphin同步数据到hbase，数据类型好像不对，这个是什么原因？

787

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

多级缓存架构实战指南

告别if-else臃肿代码！策略模式在业务中的落地实践与底层逻辑剖析

1688拍立淘图片搜索API概述

如何保证Python采集淘商品详情数据的准确性？API接口系列

阿里云位居 IDC MarketScape 中国分布式事务型数据库领导者类别

还有其他疑问?