HBase从入门到精通-经典资料汇总(持续更新v2019.10)-阿里云开发者社区

开发者社区> 阿里云数据库HBase> 正文

HBase从入门到精通-经典资料汇总(持续更新v2019.10)

简介: HBase是大数据架构中最常用的面向半结构、非结构化的存储系统,是Google三驾马车之一Bigtable的开源实现(Apache顶级项目),在国内外知名公司(Facebook、Pinterest、阿里、小米)中进行了大规模应用。此文,将从各个维度收集最好的HBase资料,方便读者各取所需。

用户福利

限时获取云数据库HBase一年仅需1元的使用权,广大HBase用户学习研究必备,更多内容请参考链接
image.png

文末有技术交流群,欢迎添加。

前言

HBase是大数据架构中最常用的面向半结构、非结构化的存储系统,是Google三驾马车之一Bigtable的开源实现(Apache顶级项目),具备高可靠、高性能、可伸缩能力。

伴随着互联网时代数据的澎湃增长,HBase在国内外知名公司(Facebook、LinkedIn、Pinterest、雅虎、阿里、小米、腾讯、滴滴等)中进行了大规模应用,并与Cloudera、AWS、微软等商业公司一起推动建设HBase生态与社区,使得HBase成为Apache基金会下最活跃的项目之一。

值得骄傲的是,HBase是国内同学参与贡献最有影响力之一的国际项目,截至目前,国内共有6位HBase PMC,10多位HBase Committer,中国力量已成为HBase生态积极壮大的核心源动力。

过去几年,围绕HBase的生态体系也正在蓬勃发展。Phoenix是基于HBase的SQL引擎,帮助解决HTAP和OLAP场景的问题;OpenTSDB是基于HBase的时序数据库,成为IoT场景的首选开源方案;JanusGraph是基于HBase的图数据库,在面向关系分析、安全风控的大数据场景成为必备品;GeoMesa是基于HBase的时空数据库,在共享出行、自动驾驶、城市大脑、智慧物流等新兴行业拥有广阔的前景空间。

学习HBase、使用HBase、开发HBase正在成为大数据领域从业者的必选项。作为HBase较早参与者之一,希望能将过去看到的很多优秀资料做一些梳理汇总,方便新手老鸟按需阅读,后续将会更新,也欢迎大家一起补充。

发展历史

  • 2006年11月:Google发布BigTable论文
  • 2007年2月:HBase宣布在Hadoop项目中成立
  • 2008年1月:Hadoop成为Apache的顶级项目,HBase成为Hadoop的子项目
  • 2010年5月:HBase成为Apache的顶级项目
  • 2010年6月:HBase-0.89发布,Facebook开始使用
  • 2011年1月:HBase-0.90发布,阿里巴巴开始使用
  • 2012年5月:HBase-0.94发布,开始广泛使用
  • 2015年2月:HBase-1.0发布
  • 2018年5月:HBase-2.0发布

产品能力

应用实践

大公司案例

HBase在大公司常使用于安全、风控、推荐、搜索、用户画像、订单存储、社交Feed流、物联网、车联网、监控、 数据大屏、日志处理、行为分析、大数据存储等各个场景

活动与圈子

  • HBaseCon:HBase官方会议,在中国和美国举办
  • 国内HBase Meetup,不定期举行,2018年总结
  • 钉钉 技术交流群,群号:23351677

image.png

  • 微信公众号:中国HBase技术社区
    image.png

生态

技术原理

成为贡献者

  • Apache HBase拥有一个非常活跃和开放的社区,如果你对HBase有任何小的改进或Bug修复,都可以反馈到社区。你也可以通过参与mail list、issue的讨论、文档的补充或翻译,去进行各种形式的贡献。
  • 目前国内有多达10多位的HBase Committer,这个队伍还在继续扩大,如果你有意成为其中一员,大家是非常乐意培养的,欢迎联系。
    image.png

推荐书籍

  • 《HBase原理与实践》

    • 适合HBase数据库的研发人员阅读,2019出版,国内资深HBase专家著作,介绍HBase的内部原理,比较全面,也适合对分布式数据库架构感兴趣的同学
      image.png
  • 《HBase不睡觉书》

    • 适合HBase应用开发人员和系统管理人员学习使用,原理和应用都有涉及,比较综合
      image.png
  • 《HBase企业应用开发实战》

    • 适合HBase应用开发人员阅读,本书强调HBase在企业的实际应用,立足于企业的实际生产环境,旨在帮助企业切实解决大数据技术如何落地的问题
      image.png
  • 《HBase实战》

    • 适合HBase应用开发人员阅读, 基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统
      image.png
  • 《HBase权威指南》

    • 适合HBase数据库的研发人员阅读,介绍内部原理为主,也适合学习分布式数据库原理的同学,内容比较全面。2012年出版,个别具体的设计内容可能已与目前版本不符
      image.png

相关论文

  1. HBase的最初理论原型Bigtable

  2. HBase底层存储HDFS的理论原型GFS

  3. No Relation: The Mixed Blessings of Non-Relational Databases
  4. [Storage Infrastructure Behind Facebook Messages
    Using HBase at Scale](http://sites.computer.org/debull/a12june/facebook.pdf)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
阿里云数据库HBase
使用钉钉扫一扫加入圈子
+ 订阅

基于Apache HBase 深度扩展,融合Spark、Phoenix、Solr等技术,支持海量数据的一站式存储、检索、分析,历经阿里巴巴近十年的大规模锤炼,被广泛用于风控、推荐、搜索、画像、社交、物联网、离线数仓等场景,助力企业数据智能化

官方博客
链接