HBASE-LSM树
HBASE-LSM树
1.B+树
关于B树、B+树、B树的了解参考:*
http://blog.csdn.net/v_july_v/article/details/6530142
优点:
走进搜索引擎的作者梁斌老师针对B树、B+树给出了他的意见(为了真实性,特引用其原话,未作任何改动):
“B+树还有一个最大的好处,方便扫库,B树必须用中序遍历的方法按序扫库,而B+树直接从叶子结点挨个扫一遍就完了,B+树支持range-query非常方便,而B树不支持。
hbase-region个数
hbase-region数量
单个regionserver配置region个数的两种方案:
根据官方推荐配置(硬盘容量);根据内存配置
一:官方推荐配置(硬盘容量):
官方文档给出的推荐:
regionserver上的region个数范围在20~200;每个region的大小在10G~30G之间,比较符合实际。
Spark On HBase Idea远程调试
本文介绍如何在本地IDEA远程调试Spark On HBase。
前提条件:
1、已经安装了Intellij IDEA,Git、Maven。2、HBase集群开通了外网地址。3、HBase集群为IDEA运行的机器开通了白名单。
HDInsight HBase的概述
HDInsight HBase的概述
什么是HBase的?
HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。
CloudManage介绍
安装链接:
http://www.cnblogs.com/lion.NET/p/5477899.html
http://www.aboutyun.com/thread-9075-1-1.html
官网:
http://www.cloudera.com/
安装方式:
建议离线安装,可以单独下载CM和CDH组件
1、CDH介绍
1.1、什么是CDH和CM?
CDH一个对Apache Hadoop的集成环境的封装,可以使用Cloudera Manager进行自动化安装。