企业打开云HBase的正确方式,来自阿里云云数据库团队的解读

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 一、HBase的历史由来 HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

一、HBase的历史由来

HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase最初是以Hadoop子项目的形式进行开发建设,直到2010年5月才正式成为Apache的顶级项目独立发展。伴随着互联网时代数据的澎湃增长,HBase作为基础存储系统得到了快速发展与应用,大批知名商业公司(Facebook、Yahoo、阿里等)自主地加入到了HBase生态建设队伍,成为Apache最活跃的社区之一。

在大批知名公司的推动下,以及结合HBase自身的能力,HBase应用场景非常广泛,例如Cube分析、推荐画像、对象存储、消息/订单存储、时序数据、Feeds流、时空数据、NewSQL等多个领域
image

二、HBase普及和应用难点

整个Hadoop技术体系也不知不觉的走过了10年的青葱岁月,但相比关系型数据库超过40年的发展,还显得稚嫩。相比成熟的关系型数据库,HBase的普及和应用,有以下难点:

  • 生产部署至少4个节点,起步成本高。
  • 原始只有API接口,偏底层,需要较强编程功底。
  • 技术资料少。
  • 社区活动少。

三、技术平民化,阿里云HBase团队在行动

为了普及和推广HBase生态,降低HBase使用难度,让更多的公司享受到HBase技术红利。

阿里云HBase团队在产品,生态,客户服务方面积极投入,希望通过微薄的力量造福整个中国HBase技术生态,让HBase技术平民化,让那些只有大公司才玩的起的技术真正走进SME,校园和广大开发者。

1、推出云HBase单节点版本,极低成本,降低使用门槛

阿里云云HBase服务正式推出单节点版本,欢迎访问https://promotion.aliyun.com/ntms/act/hbasesingle.html 了解更多。

HBase单节点版本是在集群版本的基础上推出的基础版本,相比集群版本的4个节点起步,单节点版本HBase服务全部部署在一个节点上,因此单节点版本价格非常低。同时单节点是具备小规模生产能力的,具备纵向伸缩能力,提供11个9的数据集可靠性和2个9的服务可用性,所以单节点版本非常适合开发、测试以及非核心业务小规模生产环境。

HBase单节点有以下特点:

  • 体验一致 :和云数据库HBase集群版本各种操作,监控体验一致
  • 低成本 :年度爆款,99元/3月,399元/年
  • 高性能:深度内核优化,性能高于社区版本50%-200%
  • 弹性灵活:多种规格选择,未来支持实例升级变配,选择灵活

2、提供SQL能力,造福广大DBA和开发者

过于底层的API,使得HBase使用起来难度巨大。相比原生API,SQL能力是广大DBA和开发者提升开发和使用效率的利器,云HBase服务默认包含Phoneix服务。
Phoenix是一个开源的HBASE SQL层。它不仅可以使用标准的JDBC API替代HBASE client API创建表,插入和查询HBASE,也支持二级索引、事务以及多种SQL层优化。
另外,我们在云栖社区中推出一系列专业文章,帮助HBase用户很好的理解和使用HBase和Phoenix:Phoenix系列文章。此系列文章将会从Phoenix的语法和功能特性、相关工具、实践经验以及应用案例多方面从浅入深的阐述。希望对Phoenix入门、在做架构设计和技术选型的同学能有一些帮助。
另外,功能更强大和完善的HBase SQL能力也持续研发中,HBase使用难度会进一步降低,适应场景更加广泛。

3、回馈社区,积极推动社区发展

阿里由于业务上的需要,内部深度使用HBase,内部集群规模整体超过12000台,单集群超过1000台。在长期的实践和使用中,也培养了大量的专家,积累了雄厚的技术实力,目前拥有 3 HBase PMC、6 Committer、数十位内核贡献者。我们在收获社区的技术支持的同时,也积极回馈社区,给社区贡献超过 200+ Patch,同时阿里云平台提供了多种方便易上手的数据产品工具。除了产品上,我们在社区的推广和建设中也积极投入人力和物力。


- 主办Apache HBasecon Asia 2018大会

HBaseCon大会是Apache HBase™官方举办的技术会议,发起于2012年,是HBase技术人员的盛会。阿里云主办2018届HBase亚洲大会,大会预计在下半年举行,我们会在第一时间公布在技术社区中。欢迎广大HBase技术爱好者关注。

- 打造HBase中文社区,完善HBase中文资料

HBase发源于美国,发源于社区,所以存在资料不完善,核心资料都是英文的问题,进一步加大了开发人员学习和掌握HBase的难度。
云HBase团队联合国内众多大公司的研发leader,HBase社区PMC,推出HBase中文社区,打造一个技术人员的技术交流家园,组织广大的社区爱好者积极分享HBase技术文章,共同促进HBase技术氛围的形成。也欢迎更多的同学加入HBase技术社区,一起营造HBase技术家园。

4、一颗公益之心,义务抢救客户数据

4.13日,某公司使用自建一个HBase集群挂了!整个集群有30+T 业务数据,是公司的数据中心,集群直接启动不了。他们也是经历了熬战一天一夜的情况下,依旧没有解决恢复,还曾有过重装集群重导数据念头。最后,通过钉钉HBase技术交流群找到阿里云的技术团队同学。技术同学立刻自发组成抢救小分队,尽力最大的努力,使用最低风险的方式,抢救最完整的集群。

事后,技术负责人王华激动的表示:非常感谢阿里大牛的帮助,协助我们解决了关键问题,避免了30TB业务数据遗失的重大损失。

感谢这群单纯的技术人,让HBase技术社区有温度!

四、写到最后

一项技术的发展和成熟,都要经历无数的技术人员,无数个日夜,不眠不休持续奋战。也需要集全社会的力量,更多的公司一起参与进来共同打造更好的产品和更好的生态。

阿里云HBase团队希望通过这些星星之火,点燃HBase以及整个Hadoop技术生态的草原。

普及HBase,阿里云HBase团队在行动!

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
6天前
|
SQL 存储 调度
从 Volcano 火山模型到 Pipeline 执行模型,阿里云数据库 SelectDB 内核 Apache Doris 执行模型的迭代
一个合适的执行模型对于提高查询效率和系统性能至关重要。本文全面剖析 Apache Doris Pipeline 执行模型的设计与改造历程,并在 2.1 版本对并发执行模式与调度模式进一步优化,解决了执行并发受限、执行及调度开销大等问题。
从 Volcano 火山模型到 Pipeline 执行模型,阿里云数据库 SelectDB 内核 Apache Doris 执行模型的迭代
|
8天前
|
监控 Cloud Native 大数据
即刻预约|阿里云数据库 SelectDB 版商业化发布会,5月21日14:00与您相约
2024年5月2日14:00,阿里云数据库 SelectDB 版商业化产品发布会将于线上重磅举行,即刻开启预约!👇 直播地址:https://developer.aliyun.com/special/selectdb?utm_content=g_1000393528
504 0
即刻预约|阿里云数据库 SelectDB 版商业化发布会,5月21日14:00与您相约
|
2天前
|
Cloud Native 数据管理 关系型数据库
【阿里云云原生专栏】云原生数据管理:阿里云数据库服务的分布式实践
【5月更文挑战第21天】阿里云数据库服务在云原生时代展现优势,应对分布式数据管理挑战。PolarDB等服务保证高可用和弹性,通过多副本机制和分布式事务确保数据一致性和可靠性。示例代码展示了在阿里云数据库上进行分布式事务操作。此外,丰富的监控工具协助用户管理数据库性能,支持企业的数字化转型和业务增长。
149 1
|
5天前
|
存储 人工智能 运维
|
5天前
|
Cloud Native 关系型数据库 分布式数据库
祝贺!阿里云PolarDB斩获数据库国际顶会ICDE 2024工业赛道最佳论文
阿里云斩获国际顶会ICDE 2024最佳论文,0.5秒实现数据库跨机实例迁移。
祝贺!阿里云PolarDB斩获数据库国际顶会ICDE 2024工业赛道最佳论文
|
8天前
|
Cloud Native 关系型数据库 分布式数据库
PolarDB是阿里云自主研发的关系型云原生数据库
【5月更文挑战第14天】PolarDB是阿里云自主研发的关系型云原生数据库
47 4
|
8天前
|
SQL 关系型数据库 Serverless
阿里云关系型数据库RDS
阿里云关系型数据库RDS
169 49
|
8天前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
93 0
|
9月前
|
SQL 分布式计算 Hadoop
Hadoop集群hbase的安装
Hadoop集群hbase的安装
149 0
|
7天前
|
分布式计算 Hadoop Java
Hbase2.2.2在线安装配置(对应Hadoop 3.1.3)
Hbase2.2.2在线安装配置(对应Hadoop 3.1.3)
31 2