Hbase 统计表行数的3种方式-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

Hbase 统计表行数的3种方式

pandacats 2019-12-20 21:16:20 279

转载自:http://www.hbase.group/article/41

有些时候需要我们去统计某一个hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作:

1.count命令

最直接的方式是在hbase shell中执行count的命令可以统计行数。 hbase> count ‘t1′ hbase> count ‘t1′, INTERVAL => 100000 hbase> count ‘t1′, CACHE => 1000 hbase> count ‘t1′, INTERVAL => 10, CACHE => 1000

其中,INTERVAL为统计的行数间隔,默认为1000,CACHE为统计的数据缓存。这种方式效率很低,如果表行数很大的话不建议采用这种方式。 2. 调用Mapreduce


$HBASE_HOME/bin/hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'tablename'

这种方式效率比上一种要高很多,调用的hbase jar中自带的统计行数的类。 3.hive over hbase 如果已经见了hive和hbase的关联表的话,可以直接在hive中执行sql语句统计hbase表的行数。 hive over hbase 表的建表语句为: image.png

SQL 缓存 分布式计算 Java Shell 分布式数据库 HIVE Hbase
分享到
取消 提交回答
全部回答(0)
数据库
使用钉钉扫一扫加入圈子
+ 订阅

分享数据库前沿,解构实战干货,推动数据库技术变革

推荐文章
相似问题
推荐课程