开发者学堂课程【HBase 入门教程:HBase 代码_7】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/397/detail/5079
HBase 代码_7
内容介绍:
一、HBase 代码_7
二、例子总结
三、课程总结
一、HBase 代码_7
代码:
/**
* 查询某个手机号所有王叫type=0的通话单
*/
@Test
public void scanDB2()throws Execption {
FilterList list = new FilterList(FilterList .Operator .MUST PASS _ONE/ MUST PASS _ALL);
PrefixFilter prefixFilter = new PrefixFilter ("18699732123".getBytes
());
1ist. addFilter (prefixFiiter) ;
SingleColumnValueFilter singleColumnValueFilter =
new SingleColumnValueFilter("cf1".getByte9()
,"type" .getByte5(),CompareOp.EQUAL; "0" getBytes());
list . addFilter (singleColumnValueFilte) ;
Scan scan = new Scan() ;
scan.setFilter (list) ;
ResultScanner r3s = hTable .getScanner (scan) ;
for(Result rs : r3s){
System. out.println (new String (Cel1Util.cloneValue (rs . getColumnLatestCell("cf1".ge
+ new String (Cel1Util. cloneValue (rs .getColumnLatestCell ("cf1" .getBytes(),+ new Strina(Cel10ti1. cloneVa lue (rs
。cetColumnLatestCell ("Cf1".get)
}
代码写完之后,在输出查看结果。(找到 scanDB2右键 èRun Asè1 Junit Test 输出)(结果如下图:)
把所有的0全部输出,想要把 rowkey 输出,代码如下:
代码:
//在循环下面写
String rowkey = new String(rs. qe tColumnLatestCell ("cf1" .qetBytes()
,"type" . getBytes ()) .getRow())
//在到输出语句里添加 rowkey
在输出查看一下 rowkey。(找到 scanDB2右键 èRun Asè1 Junit Test 输出)
如果还想要好看的话,在手机号和时间里面加入下划线。手机号是同一个,类型是0,都是我们的主要类型,满足我们的业务需求。
二、例子总结
做查询写了两个例子,
第一个例子:做一个范围的查询;
第二个例子:是过滤器的一个使用。
过滤器其实很简单,只要把 setFilter 进去就可以了。下面的循环就是把结果拿到在输出出来,真正有用的是前面的那一部分代码,同学们注意看代码不要觉得对的就很难,其实它是很简单的,反而短的才会很难。
方法写完了之后我们在回过头来看一下整体代码,关于对 hbase 的操作,如果你是对表进行操作的话,我们都是通过 hbaseadmin 来做的。表里面的一些属性、数据我们是用 htable 来做的。在这边写了创建表的方法(createTb1),需要注意的是在创建表的时候需要给定你的列祖。在对属于这些属性的设置都是在列祖的程次上做的,包括缓存,最大使用内存,版本数都是在列祖程面上去做的。包括后面写的 insertDb 这个方法,都说明一个问题,在 hbase 当中来设计 rowkey,rowkey 的设计很重要。
最后就是把两个 scanDB 方法写完了,在使用 can 来查找的时候,就拿我们这个主教。如果是对于之前的关系型数据库直接写一个 where 条件就完事了,但是在这边只能使用过滤器,过滤器的效率不是很高,所有rowkey的设计很重要。我们通常设计的时候,把主要查询的业务放在你的 rowkey 当中,rowkey 设计必须要结合我们的业务来说。为什么说 rowkey 设计很重要,首先在 hbase 查询的时候,只能通过 rowkey 来进行过滤,除了你的过滤器,你的索引只是可以在 rowkey 这一层面。而且 rowkey 的长度是有限的,长度是64kb,所以 rowkey 不能特别特别的长。
三、课程总结
Hbase 这一块:
首先介绍 hbase,观看 hadoop 的生态图。在 hbase 生态图中,要明白每个主键是来做什么的。Hbase 的一些特性,一定要清楚。Hbase 和 zookeeper 的一个关系,它不仅只是做一个高可用的,还可以做很多事情。Hbase 数据模型,在 hbase 上市资这么存储的,介绍了 rowkey 列族和 cf,cf 顾名思义它市代表你在列里面的一个家族。主要注意的是,在创建表的时候,要给定它的列族。