开发者社区> 问答> 正文

云数据库 HBase版的应用场景

云栖大讲堂 2017-11-02 16:14:50 1193


应用场景


ApsaraDB for HBase的使用场景比较广泛,以至于很多客户无法把握他。以下我们大致列下,适合的场景:

HBase的设计之初是为了存储互联网,[backcolor=transparent]几乎所有非事务类结构化的存储需求都可以使用HBASE来满足。HBase是NoSql,讲的是Not only SQL,也是支持SQL及二级索引的。在整个数据的世界里,事务是比较少,占了不到1%的份额,大部分的数据存储都是无事务的。
目前阿里的使用情况:

在讲述具体的HBase场景,我们先看下HBase在整个数据处理大图之间的位置:
云HBase处于数据存储的位置,自带分析的功能
1、数据来源的途径有:
  • 通过业务 ECS 直接写入到 云HBase之中
  • 有一些消息中间件自带push功能,可以直接写入到HBase之中;有一些不行,需要拉取消息再转化处理后写入到HBase之中
  • 通过流式系统,比如:SparkStreaming、Flink、Storm等流式引擎计算写入到云HBase之中
  • 从离线同步数据到云HBase之中,一般为T+1同步
  • 从关系型数据库同步数据到云Hbase之中,可以做到实时同步
  • 在机器学习场景中,直接把云Hbase作为存储

2、云HBase的数据的去向:
  • 云HBase自带Phoenix模块分析,支持百亿的毫秒级别分析
  • 通过Spark等离线分析引擎分析
  • ECS业务端查询,如Scan一些数据,在客户端展示


物联网大数据



HBase天生适合物联网的场景,比如:单车、物流轨迹类 等等

大数据类



满足安全风控、大数据处理、搜索等等具体的场景,一般跟流式系统、离线系统结合

大数据存储类、包括历史数据存储



存储包括各类数据,比如:日志、订单、交易数据、消息等等,在线实时写入,在实时查询。历史数据查询批量低,需要分层存储,云HBase预计在12月份支持冷热数据分离存储,降低存储成本

实时分析类



在百亿的数据量下,秒级别返回数据,适合 报表、统计等需求
存储 消息中间件 SQL 弹性计算 大数据 物联网 BI 分布式数据库 流计算 Hbase
分享到
取消 提交回答
全部回答(0)
+ 订阅

分享数据库前沿,解构实战干货,推动数据库技术变革

推荐文章
相似问题
推荐课程