客户之声为你探究PB级云数据库HBase-阿里云开发者社区

开发者社区> ali阿瑟> 正文

客户之声为你探究PB级云数据库HBase

简介: 阿里云在近期推出了云HBase产品,客户使用情况如何?此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化;本专题将会为你详细介绍。
+关注继续查看

如果有云HBase需求,抢先使用

客户之声

有一家中国领先的车商服务平台,最近在使用云HBase,在实时业务线中,要处理 TB 级的的数据量,同时又要保证读写的效率,在数据库的选择上。经过多重考虑,最终决定采用阿里云HBase 来处理这些数据。


选择阿里云HBase主要基于以下考虑:


1、数据整体的技术栈都是基于Hadoop
HBase是Apache的Hadoop项目的子项目,阿里云HBase完全兼容Apache HBase 的接口,选择阿里云HBase可以更好的同其他组件集成,例如:Spark可以方便读写HBase中的数据;通过 Flume可以将Kafka中的数据写入阿里云 HBase。


2、阿里云HBase可以提供更强大的查询功能
阿里云HBase 完全兼容了社区版本的接口, HBase中原有丰富的过滤器仍可以使用在阿里云 Hbase。同时社区中Phoneix等SQL方案也在逐渐成熟, 后期SQL ON HBase 也有更多的选择。


3、由阿里云承担基础运维, 服务更有保障
HBase要提供线上服务, 服务稳定性的要求更高。对于没有运维经验的团队来说, 阿里云 HBase 是更好的选择。这个也是吸引我们使用阿里云 HBase 最主要的原因。阿里云承诺99.95%的稳定性及9个9的数据可靠性,超过自己可以实现的运维能力。


于是在调研后, 首先被应用到阿里云HBase上的业务是一个新业务:基础服务中的 GIS 服务。存储了大量GPS上报的地理位置数据, 并提供风控后台的数据接口。

TB1bcw4PVXXXXXiapXXXXXXXXXX-828-521.png


使用中的反馈


现在生产数据上线只有两周, 日写入数据GB级别,总体感觉目前系统还没有出现运维问题,解决了后顾之忧,而且与社区版本完全兼容,避免了不必要的工作量。创业公司的时间就是金钱,这里点一个大大的赞。 
经过这次尝试,阿里云的HBase的成绩有目共睹,后续公司内的实时业务也会陆续从自建的HBase迁移到阿里云HBase 中,减少运维的风险。

云HBase介绍


云HBase的内核,是基于开源社区1.1版本系列,在此之上深度改造,之前阿里在较早版本有较多的优化也会渐渐迁移到此版本中。目前服务了整个集团的大数据结构化存储需求。如: 
1、平台类:如目前很流行的kylin,日志同步工具TT,图组件Titan等。此类存放的是平台类数据,作为平台的底层存储使用。 
2、用户行为类:如淘宝收藏夹、交易数据、聊天记录、物联网数据等。这里使用比较直接,就直接存放HBase,再读取。 
3、报表类:比如报表、数据大屏等

TB13jbiPFXXXXX5XVXXXXXXXXXX-868-396.png


随着互联网的发展,我们遇到很多中小公司,都有数T、数P的HBase集群,且这些集群没有改动过一行HBase源代码,出现问题后无从下手,导致服务长时间不可用甚至面临数据丢失的风险,更加不会去改造HBase以满足日益增长业务需求。 

云HBase团队,源于对内核的深度改造,满足日益复杂化、多样化的大数据存储需求。阿里从2011年初开始步入HBase的发展、建设之路,是国内最早应用、研究、发展、回馈的团队,也诞生了HBase社区在国内的第一位Committer,成为HBase在中国发展的积极布道者 过去的几年时间,阿里累积向社区回馈了上百个Patch, 在诸多核心模块的功能、稳定性、性能作出积极重大的贡献,拥有多位Committer,成为推动HBase的长远发展的重要力量之一。

云HBase建设


主要是两个体系


管控体系:由于我们有数千个、甚至数万个HBase集群,所以,我们必须是自动化的。这个体系建设的是怎么去管控好上万级HBase集群,为数万家公司提供云HBase的服务。 
内核建设:目前云HBase主要围绕云上构建HBase,需要充分利用云的优势,比如:弹性、资源无限、随时随地、默认有多个可用区及多个地区。我们主要围绕:性能、运维、成本、安全、可用性、功能等方案建设内核。

TB1ueC8PFXXXXaJaXXXXXXXXXXX-901-346.png


以上内容是否对你有帮助, 查看云数据库HBase
关于更多的云HBase的讨论,可加入HBase钉钉群:
32bdb37770f15e0b6c93c7794e5571265ece14bf

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
标记(TAG)您的MongoDB数据库实例
为了方便管理阿里云MongoDB数据库实例,您可以选择通过标签的形式为每个资源分配您自己的元数据。本主题介绍标签并说明如何创建标签。
886 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
4505 0
客户之声为你探究PB级云数据库HBase
阿里云在近期推出了云HBase产品,客户使用情况如何?此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化;本专题将会为你详细介绍。
3000 0
PowerDesinger逆向数据库物理模型及关系图
原文:PowerDesinger逆向数据库物理模型及关系图 利用PowerDesinger生成的数据库物理模型及关系图 收集五年的开发资料下载地址:  http://pan.baidu.com/share/home?uk=4076915866&view=share   在数据库建模的过程中,需要运用PowerDesigner进行数据库设计,这个不但让人直观的理解模型,而且可以充分的利用数据库技术,优化数据库的设计。
959 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
10775 0
揭秘 | 双11逆天记录背后的数据库技术革新
第十个天猫“双11”狂欢节圆满落幕,如今双11已不仅仅是天猫的盛会,更是阿里技术人的新年
1522 0
+关注
ali阿瑟
阿里云解决方案架构师,在互联网行业从业多年。对互联网、传统企业使用云计算有较多的实战经验。
7
文章
0
问答
来源圈子
更多
阿里云数据库:帮用户承担一切数据库风险,给您何止是安心!支持关系型数据库:MySQL、SQL Server、PostgreSQL、PPAS(完美兼容Oracle)、自研PB级数据存储的分布式数据库Petadata、自研金融级云数据库OceanBase支持NoSQL数据库:MongoDB、Redis、Memcache更有褚霸、丁奇、德哥、彭立勋、玄惭、叶翔等顶尖数据库专家服务。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载