开发者社区> 问答> 正文

什么时候适用Hbase?

什么时候适用Hbase?

展开
收起
芯在这 2021-12-08 14:51:12 393 0
1 条回答
写回答
取消 提交回答
  • 半结构化或非结构化数据 -- 对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用HBase。当业务发展需要存储author的email,phone,address信息时RDBMS需要停机维护,而HBase支持动态增加.

    记录非常稀疏 -- RDBMS的行有多少列是固定的,为null的列浪费了存储空间。而HBase为null的Column不会被存储,这样既节省了空间又提高了读性能。

    多版本数据 -- 根据Row key和Column key定位到的Value可以有任意数量的版本值,因此对于需要存储变动历史记录的数据,用HBase就非常方便了。比如author的Address是会变动的,业务上一般只需要最新的值,但有时可能需要查询到历史值。

    超大数据量 -- 当数据量越来越大,RDBMS数据库撑不住了,就出现了读写分离策略,通过一个Master专门负责写操作,多个Slave负责读操作,服务器成本倍增。随着压力增加,Master撑不住了,这时就要分库了,把关联不大的数据分开部署,一些join查询不能用了,需要借助中间层。随着数据量的进一步增加,一个表的记录越来越大,查询就变得很慢,于是又得搞分表,比如按ID取模分成多个表以减少单个表的记录数。经历过这些事的人都知道过程是多么的折腾。采用HBase就简单了,只需要加机器即可,HBase会自动水平切分扩展,跟Hadoop的无缝集成保障了其数据可靠性(HDFS)和海量数据分析的高性能(MapReduce)。

    2021-12-08 14:51:36
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
HBase at Xiaomi 立即下载
Hbase at DiDi 立即下载
HBase 3.0 立即下载