用户福利
限时获取云数据库HBase一年仅需1元的使用权,广大HBase用户学习研究必备,更多内容请参考链接。

文末有技术交流群,欢迎添加。
前言
HBase是大数据架构中最常用的面向半结构、非结构化的存储系统,是Google三驾马车之一Bigtable的开源实现(Apache顶级项目),具备高可靠、高性能、可伸缩能力。
伴随着互联网时代数据的澎湃增长,HBase在国内外知名公司(Facebook、LinkedIn、Pinterest、雅虎、阿里、小米、腾讯、滴滴等)中进行了大规模应用,并与Cloudera、AWS、微软等商业公司一起推动建设HBase生态与社区,使得HBase成为Apache基金会下最活跃的项目之一。
值得骄傲的是,HBase是国内同学参与贡献最有影响力之一的国际项目,截至目前,国内共有6位HBase PMC,10多位HBase Committer,中国力量已成为HBase生态积极壮大的核心源动力。
过去几年,围绕HBase的生态体系也正在蓬勃发展。Phoenix是基于HBase的SQL引擎,帮助解决HTAP和OLAP场景的问题;OpenTSDB是基于HBase的时序数据库,成为IoT场景的首选开源方案;JanusGraph是基于HBase的图数据库,在面向关系分析、安全风控的大数据场景成为必备品;GeoMesa是基于HBase的时空数据库,在共享出行、自动驾驶、城市大脑、智慧物流等新兴行业拥有广阔的前景空间。
学习HBase、使用HBase、开发HBase正在成为大数据领域从业者的必选项。作为HBase较早参与者之一,希望能将过去看到的很多优秀资料做一些梳理汇总,方便新手老鸟按需阅读,后续将会更新,也欢迎大家一起补充。
发展历史
- 2006年11月:Google发布BigTable论文
- 2007年2月:HBase宣布在Hadoop项目中成立
- 2008年1月:Hadoop成为Apache的顶级项目,HBase成为Hadoop的子项目
- 2010年5月:HBase成为Apache的顶级项目
- 2010年6月:HBase-0.89发布,Facebook开始使用
- 2011年1月:HBase-0.90发布,阿里巴巴开始使用
- 2012年5月:HBase-0.94发布,开始广泛使用
- 2015年2月:HBase-1.0发布
- 2018年5月:HBase-2.0发布
产品能力
应用实践
-
关于Rowkey设计
-
社交Feed流场景
-
监控系统场景
-
搜索与推荐场景
-
风控场景
-
用户画像
-
物联网/车联网
- 数据大屏
-
订单类场景
-
地理与时空
-
数据迁移
大公司案例
HBase在大公司常使用于安全、风控、推荐、搜索、用户画像、订单存储、社交Feed流、物联网、车联网、监控、 数据大屏、日志处理、行为分析、大数据存储等各个场景
-
阿里巴巴
-
腾讯
-
Facebook
-
HBase在消息系统的应用:介绍Facebook消息系统选择HBase存储的原因,包括电子邮件、即时通讯、短信、文本信息、Facebook站内信息
-
Pinterest
-
滴滴
-
网易
-
京东
-
小米
-
百度
-
快手
-
Hulu
-
中国人寿
-
G7
活动与圈子
-
HBaseCon:HBase官方会议,在中国和美国举办
- 国内HBase Meetup,不定期举行,2018年总结
- 钉钉 技术交流群,群号:23351677

- 微信公众号:中国HBase技术社区
生态
技术原理
成为贡献者
- Apache HBase拥有一个非常活跃和开放的社区,如果你对HBase有任何小的改进或Bug修复,都可以反馈到社区。你也可以通过参与mail list、issue的讨论、文档的补充或翻译,去进行各种形式的贡献。
- 目前国内有多达10多位的HBase Committer,这个队伍还在继续扩大,如果你有意成为其中一员,大家是非常乐意培养的,欢迎联系。
推荐书籍
-
《HBase原理与实践》
- 适合HBase数据库的研发人员阅读,2019出版,国内资深HBase专家著作,介绍HBase的内部原理,比较全面,也适合对分布式数据库架构感兴趣的同学
-
《HBase不睡觉书》
- 适合HBase应用开发人员和系统管理人员学习使用,原理和应用都有涉及,比较综合
-
《HBase企业应用开发实战》
- 适合HBase应用开发人员阅读,本书强调HBase在企业的实际应用,立足于企业的实际生产环境,旨在帮助企业切实解决大数据技术如何落地的问题
-
《HBase实战》
- 适合HBase应用开发人员阅读, 基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统
-
《HBase权威指南》
- 适合HBase数据库的研发人员阅读,介绍内部原理为主,也适合学习分布式数据库原理的同学,内容比较全面。2012年出版,个别具体的设计内容可能已与目前版本不符
相关论文
-
HBase的最初理论原型Bigtable
-
HBase底层存储HDFS的理论原型GFS
- No Relation: The Mixed Blessings of Non-Relational Databases
- [Storage Infrastructure Behind Facebook Messages
Using HBase at Scale](http://sites.computer.org/debull/a12june/facebook.pdf)