HBase,轻松应对大数据时代的储存

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 本文PPT来自阿里中间件高级专家沈春辉于10月16日在2016年杭州云栖大会上发表的《大数据时代的储存——HBase的实践与探索》。

本文PPT来自阿里中间件高级专家沈春辉于10月16日在2016年杭州云栖大会上发表的《大数据时代的储存——HBase的实践与探索》。

我们现在都过着一个数据驱动的生活,不管是安全风控、生意参谋、还是借贷保险、或是出行决策,背后都少不了大数据的支撑。大数据场景本身固有的数据基础量大、增长快、时效性短、易发散和易产生脏数据等问题,导致人们投入了大量的精力来开发处理解决这些问题的数据库系统,比如Teradata、MongoDB、Cassandra、HBase、PostgreSQl等。

在这些系统就有我们今天的主角——HBase。HBase,全称Hadoop Database,是一个基于Google BigTable论文设计的高可靠性、高性能、可伸缩的分布式储存系统。HBase支持实时更新、增量导入、多维删除、随机查询、范围查询等功能,具有自动分区、LSM Tree、储存计算分离和Hadoop生态这四大基因。由于期性能优越,HBase已经被微软、雅虎、阿里巴巴、Facebook等大公司使用。目前,HBase投入使用的应用实例包括基于大数据的安全风控、实时计算的数字大屏、海量数据的基础储存等。

阿里对HBase很重视,并且对HBase的储存建设也投入了很多。基于阿里巴巴/蚂蚁的环境和业务需求,阿里对社区HBase进行深度定制与改进,从内核引擎、解决方案、稳定护航、发展支撑全方位提供一站式大数据基础存储服务,其中包括如灾备体系、实时监控、数据排行等特色功能。未来,阿里将持续建设HBase,实现HBase的容器化部署,以提升资源使用率、实现跨应用混部和加强资源伸缩灵活性,并且随着云的不断建设,HBase上云的日子也指日可待了。

49920bf2f81e161a09301715cc5c941707c1297d

49920bf2f81e161a09301715cc5c941707c1297d

baf7170012d5f58c4e57a02ff572792de2e3c7a2

8b0f71833415e8970aeaad8fbede9b08f7b14642

30eab50c77dacd505994b78c4127b291ec0999a4

785fef86f0d375a0561a425a33a69122c3b34bca

bed09fab2ea4f999fd6735a6e4cc1aa8649ba628

ac4e99444f5ec81d042967e6c79ea6cb8d165e4f

3478143294c9852654657a4fdad079873de58865

242255ecec5d1faf43c68df19e920866865d1d21

be8b4d60655a87e5bc201b210745b9394016f8bb

c009096b1df4e678446b7d93a53bc27a42c60f45

224604a3454b280b254b9ef5a949b7f752db25a7

3fe6e53801762129f16dcf4e8b5b43de007e966d

561b55c753a59c48bb0cebef28562d38bbc5f238

ae287b8611825299eb64189d325c75ec6b3aa640

40ba2cf7d4106ad039007dc140902db323d9f9a2

0dbdf841d72c0ba55f8113b26a97e0ed152ab8bf


相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
5月前
|
Java 大数据 分布式数据库
Spring Boot 与 HBase 的完美融合:探索高效大数据应用开发的新途径
【8月更文挑战第29天】Spring Boot是一款广受好评的微服务框架,以其便捷的开发体验著称。HBase则是一个高性能的大数据分布式数据库系统。结合两者,可极大简化HBase应用开发。本文将对比传统方式与Spring Boot集成HBase的区别,展示如何在Spring Boot中优雅实现HBase功能,并提供示例代码。从依赖管理、连接配置、表操作到数据访问,Spring Boot均能显著减少工作量,提升代码可读性和可维护性,使开发者更专注业务逻辑。
307 1
|
4月前
|
存储 分布式计算 分布式数据库
深入理解Apache HBase:构建大数据时代的基石
在大数据时代,数据的存储和管理成为了企业面临的一大挑战。随着数据量的急剧增长和数据结构的多样化,传统的关系型数据库(如RDBMS)逐渐显现出局限性。
593 12
|
5月前
|
分布式计算 大数据 分布式数据库
"揭秘HBase MapReduce高效数据处理秘诀:四步实战攻略,让你轻松玩转大数据分析!"
【8月更文挑战第17天】大数据时代,HBase以高性能、可扩展性成为关键的数据存储解决方案。结合MapReduce分布式计算框架,能高效处理HBase中的大规模数据。本文通过实例展示如何配置HBase集群、编写Map和Reduce函数,以及运行MapReduce作业来计算HBase某列的平均值。此过程不仅限于简单的统计分析,还可扩展至更复杂的数据处理任务,为企业提供强有力的大数据技术支持。
89 1
|
6月前
|
存储 NoSQL 大数据
大数据存储:HBase与Cassandra的对比
【7月更文挑战第16天】HBase和Cassandra作为两种流行的分布式NoSQL数据库,在数据模型、一致性模型、数据分布、查询语言和性能等方面各有千秋。HBase适用于需要强一致性和与Hadoop生态系统集成的场景,如大规模数据处理和分析。而Cassandra则更适合需要高可用性和灵活查询能力的场景,如分布式计算、云计算和大数据应用等。在实际应用中,选择哪种数据库取决于具体的需求和场景。希望本文的对比分析能够帮助读者更好地理解这两种数据库,并做出明智的选择。
|
6月前
|
存储 Java 分布式数据库
使用Spring Boot和HBase实现大数据存储
使用Spring Boot和HBase实现大数据存储
|
7月前
|
Java 大数据 API
【大数据】HDFS、HBase操作教程(含指令和JAVA API)
【大数据】HDFS、HBase操作教程(含指令和JAVA API)
159 0
【大数据】HDFS、HBase操作教程(含指令和JAVA API)
|
7月前
|
存储 大数据 分布式数据库
使用Apache HBase进行大数据存储:技术解析与实践
【6月更文挑战第7天】Apache HBase,一个基于HDFS的列式存储NoSQL数据库,提供高可靠、高性能的大数据存储。其特点是列式存储、可扩展至PB级数据、低延迟读写及多版本控制。适用场景包括大规模数据存储、实时分析、日志存储和推荐系统。实践包括集群环境搭建、数据模型设计、导入、查询及性能优化。HBase在大数据存储领域扮演关键角色,未来有望在更多领域发挥作用。
|
7月前
|
存储 分布式计算 Hadoop
【大数据】分布式数据库HBase下载安装教程
【大数据】分布式数据库HBase下载安装教程
213 0
|
7月前
|
存储 缓存 大数据
【大数据】分布式数据库HBase
【大数据】分布式数据库HBase
132 0
|
8月前
|
存储 分布式计算 Java
大数据存储技术(3)—— HBase分布式数据库
大数据存储技术(3)—— HBase分布式数据库
2006 0