客户之声为你探究PB级云数据库HBase

本文涉及的产品
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 MongoDB,通用型 2核4GB
简介: 阿里云在近期推出了云HBase产品,客户使用情况如何?此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化;本专题将会为你详细介绍。
+关注继续查看

如果有云HBase需求,抢先使用

客户之声

有一家中国领先的车商服务平台,最近在使用云HBase,在实时业务线中,要处理 TB 级的的数据量,同时又要保证读写的效率,在数据库的选择上。经过多重考虑,最终决定采用阿里云HBase 来处理这些数据。


选择阿里云HBase主要基于以下考虑:


1、数据整体的技术栈都是基于Hadoop
HBase是Apache的Hadoop项目的子项目,阿里云HBase完全兼容Apache HBase 的接口,选择阿里云HBase可以更好的同其他组件集成,例如:Spark可以方便读写HBase中的数据;通过 Flume可以将Kafka中的数据写入阿里云 HBase。


2、阿里云HBase可以提供更强大的查询功能
阿里云HBase 完全兼容了社区版本的接口, HBase中原有丰富的过滤器仍可以使用在阿里云 Hbase。同时社区中Phoneix等SQL方案也在逐渐成熟, 后期SQL ON HBase 也有更多的选择。


3、由阿里云承担基础运维, 服务更有保障
HBase要提供线上服务, 服务稳定性的要求更高。对于没有运维经验的团队来说, 阿里云 HBase 是更好的选择。这个也是吸引我们使用阿里云 HBase 最主要的原因。阿里云承诺99.95%的稳定性及9个9的数据可靠性,超过自己可以实现的运维能力。


于是在调研后, 首先被应用到阿里云HBase上的业务是一个新业务:基础服务中的 GIS 服务。存储了大量GPS上报的地理位置数据, 并提供风控后台的数据接口。

TB1bcw4PVXXXXXiapXXXXXXXXXX-828-521.png


使用中的反馈


现在生产数据上线只有两周, 日写入数据GB级别,总体感觉目前系统还没有出现运维问题,解决了后顾之忧,而且与社区版本完全兼容,避免了不必要的工作量。创业公司的时间就是金钱,这里点一个大大的赞。 
经过这次尝试,阿里云的HBase的成绩有目共睹,后续公司内的实时业务也会陆续从自建的HBase迁移到阿里云HBase 中,减少运维的风险。

云HBase介绍


云HBase的内核,是基于开源社区1.1版本系列,在此之上深度改造,之前阿里在较早版本有较多的优化也会渐渐迁移到此版本中。目前服务了整个集团的大数据结构化存储需求。如: 
1、平台类:如目前很流行的kylin,日志同步工具TT,图组件Titan等。此类存放的是平台类数据,作为平台的底层存储使用。 
2、用户行为类:如淘宝收藏夹、交易数据、聊天记录、物联网数据等。这里使用比较直接,就直接存放HBase,再读取。 
3、报表类:比如报表、数据大屏等

TB13jbiPFXXXXX5XVXXXXXXXXXX-868-396.png


随着互联网的发展,我们遇到很多中小公司,都有数T、数P的HBase集群,且这些集群没有改动过一行HBase源代码,出现问题后无从下手,导致服务长时间不可用甚至面临数据丢失的风险,更加不会去改造HBase以满足日益增长业务需求。 

云HBase团队,源于对内核的深度改造,满足日益复杂化、多样化的大数据存储需求。阿里从2011年初开始步入HBase的发展、建设之路,是国内最早应用、研究、发展、回馈的团队,也诞生了HBase社区在国内的第一位Committer,成为HBase在中国发展的积极布道者 过去的几年时间,阿里累积向社区回馈了上百个Patch, 在诸多核心模块的功能、稳定性、性能作出积极重大的贡献,拥有多位Committer,成为推动HBase的长远发展的重要力量之一。

云HBase建设


主要是两个体系


管控体系:由于我们有数千个、甚至数万个HBase集群,所以,我们必须是自动化的。这个体系建设的是怎么去管控好上万级HBase集群,为数万家公司提供云HBase的服务。 
内核建设:目前云HBase主要围绕云上构建HBase,需要充分利用云的优势,比如:弹性、资源无限、随时随地、默认有多个可用区及多个地区。我们主要围绕:性能、运维、成本、安全、可用性、功能等方案建设内核。

TB1ueC8PFXXXXaJaXXXXXXXXXXX-901-346.png


以上内容是否对你有帮助, 查看云数据库HBase
关于更多的云HBase的讨论,可加入HBase钉钉群:
32bdb37770f15e0b6c93c7794e5571265ece14bf

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
10月前
|
安全 分布式数据库 数据库
|
存储 运维 供应链
云数据库HBase增强版全文索引助力收钱吧低成本、高性能实现订单搜索
收钱吧,隶属于上海喔噻互联网科技有限公司,是中国移动支付服务商领军者,致力于用网络和数据的力量服务线下实体商家。收钱吧不仅为商家提供专业移动支付收款工具,同时也是为商家提供金融、广告、营销管理、供应链等多种服务的生意帮手。2014年12月,收钱吧正式上线,开创了中国移动支付市场“一站式收款”时代,并成功研发了“收钱吧扫码王”等全场景智能收款设备,产品获得多项国家专利。目前收钱吧服务超过330万商家,日服务3000万人次。
1370 0
云数据库HBase增强版全文索引助力收钱吧低成本、高性能实现订单搜索
|
存储 SQL 容灾
云数据库 HBase应用场景及优势
ApsaraDB for HBase是一个键值/宽表型的分布式数据库,适用于任何数据规模,可以提供单个毫秒响应的性能,尤其擅长低成本、高并发的场景,支持水平扩展到PB级存储和千万级QPS,在淘宝、支付宝、菜鸟等众多阿里巴巴核心服务中起到了关键支撑的作用。
1047 0
|
分布式数据库 Hbase 存储
云数据库HBase降价优惠,最低1元包年,震撼来袭!
云数据库HBase版是面向大数据领域的一站式NoSQL服务, 支持GB至PB级数据,用于处理大规模吞吐、检索、分析工作负载, 目前正降价优惠中!
26636 0
云数据库HBase降价优惠,最低1元包年,震撼来袭!
|
存储 数据采集 分布式计算
云数据库HBase降价优惠,震撼来袭!
云数据库HBase版是面向大数据领域的一站式NoSQL服务, 支持GB至PB级数据,用于处理大规模吞吐、检索、分析工作负载, 目前正降价优惠中!
331 0
云数据库HBase降价优惠,震撼来袭!
|
弹性计算 分布式数据库 数据库
云数据库HBase如何设置访问白名单?
今天这篇文章主要介绍一下如何在HBase控台上设置HBase白名单。 我们来到HBase控制台页面。 我们看到这里已经有一个按量付费的经典网络HBase集群。点击管理,进入集群详情页面。 在详情页面的第三栏网络信息的右边有一个修改网络白名单按钮,我们点击它。
1519 0
|
Web App开发 分布式计算 关系型数据库
云HBase Spark分析引擎对接云数据库POLARDB
HBase Spark分析引擎是云数据库HBase版提供的分析引擎,基于Spark提供的复杂分析、流式处理、机器学习的能力。Spark分析引擎可以对接阿里云的各种数据源,例如:云HBase数据、MongoDB、Phoenix等,同时也支持对接POLARDB数据库。
2106 0
|
分布式数据库 数据库 Hbase
|
SQL 存储 API
企业打开云HBase的正确方式,来自阿里云云数据库团队的解读
一、HBase的历史由来 HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
4206 0
相关产品
云原生多模数据库 Lindorm
云数据库 Redis 版
云数据库 MongoDB 版
推荐文章
更多