开发者社区> 问答> 正文

云数据库 HBase版的应用场景



应用场景


ApsaraDB for HBase的使用场景比较广泛,以至于很多客户无法把握他。以下我们大致列下,适合的场景:

HBase的设计之初是为了存储互联网,[backcolor=transparent]几乎所有非事务类结构化的存储需求都可以使用HBASE来满足。HBase是NoSql,讲的是Not only SQL,也是支持SQL及二级索引的。在整个数据的世界里,事务是比较少,占了不到1%的份额,大部分的数据存储都是无事务的。
目前阿里的使用情况:

在讲述具体的HBase场景,我们先看下HBase在整个数据处理大图之间的位置:
云HBase处于数据存储的位置,自带分析的功能
1、数据来源的途径有:

  • 通过业务 ECS 直接写入到 云HBase之中
  • 有一些消息中间件自带push功能,可以直接写入到HBase之中;有一些不行,需要拉取消息再转化处理后写入到HBase之中
  • 通过流式系统,比如:SparkStreaming、Flink、Storm等流式引擎计算写入到云HBase之中
  • 从离线同步数据到云HBase之中,一般为T+1同步
  • 从关系型数据库同步数据到云Hbase之中,可以做到实时同步
  • 在机器学习场景中,直接把云Hbase作为存储

2、云HBase的数据的去向:
  • 云HBase自带Phoenix模块分析,支持百亿的毫秒级别分析
  • 通过Spark等离线分析引擎分析
  • ECS业务端查询,如Scan一些数据,在客户端展示


物联网大数据



HBase天生适合物联网的场景,比如:单车、物流轨迹类 等等

大数据类



满足安全风控、大数据处理、搜索等等具体的场景,一般跟流式系统、离线系统结合

大数据存储类、包括历史数据存储



存储包括各类数据,比如:日志、订单、交易数据、消息等等,在线实时写入,在实时查询。历史数据查询批量低,需要分层存储,云HBase预计在12月份支持冷热数据分离存储,降低存储成本

实时分析类



在百亿的数据量下,秒级别返回数据,适合 报表、统计等需求

展开
收起
云栖大讲堂 2017-11-02 16:14:50 2667 0
1 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载
云时代的数据库技术趋势 立即下载
超大型金融机构国产数据库全面迁移成功实践 立即下载