HDInsight HBase的概述

简介: HDInsight HBase的概述什么是HBase的?HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。

HDInsight HBase的概述


什么是HBase的


HBase的建立在Hadoop的Apache的开源的NoSQL数据库,提供大量的非结构化和半结构化数据随机存取和强大的一致性。是仿照谷歌的BigTable一个列面向家庭的数据库数据被存储在一排内的数据的行是由列族分组。 HBase的在这个意义上,无论是也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库。开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点。可以依靠数据冗余,批处理和通过在Hadoop的生态系统的分布式应用程序提供的其他功能。

什么是Azure的HDInsight HBase的


HDInsight HBase的是提供一个管理的集群集成到Azure的环境集群被配置为直接在Azure的Blob存储,这提供了在性能/成本的选择低延迟和增加的弹性存储数据。这使客户能够建立一个大型数据集工作的互动式网站构建存储传感器和遥测数据,从数以百万计的端点服务并分析这些数据与Hadoop作业 HBase的Hadoop的都是很好的出发点,Azure的大数据项目,特别是可以实现实时应用大型数据集工作。

HDInsight实现利用的HBase横向扩展架构,可提供自动分片表,一致性读取和写入自动故障转移性能提高内存高速缓存读取和高吞吐量数据流写入虚拟网络配置也可用于HDInsight HBase的有关详细信息,请参阅提供HDInsight集群在Azure虚拟网络

如何HDInsight HBase的数据管理


数据可以HBase的使用创造GET,PUT和ScanHBase的shell命令来管理。数据使用付诸表决,并阅读使用get命令写入到数据库中Scan命令被用于获得在表中多行的数据。数据也可以使用HBase的C#的API,它提供了一个客户机库HBase的REST API之上管理。一个HBase的数据库也可以使用配置单元查询。的介绍,这些编程模型,请参阅获取使用HBase的用HadoopHDInsight开始协处理器也可以允许数据库所在的节点数据的处理。

场景:什么是用例HBase的


BigTable的推而广之HBase的创建为其典型使用案例就是网络搜索搜索引擎建立一个映射条款,包含它们的网页索引。但也有许多其他的用例HBase的适合哪几个逐项列出在本节

用例1key-value存储


HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的使用HBase的为自己的邮件系统,它是理想的存储和管理互联网通信 WebTable使用HBase的搜索和管理从网页中提取表。

使用案例2:传感器数据


HASE用于捕捉是从各种来源的增量收集的数据是有用的。这包括社交分析时间序列保持交互式仪表盘的最新潮流和计数器以及管理审计日志系统。例子包括Bloomberg 交易终端和开放时间序列数据库(OpenTSDB)的商店,并提供访问收集服务器系统健康指标

用例3:实时查询


Phoenix 是Apache HBase的一个SQL查询引擎它是作为一个JDBC驱动程序,并能使查询和使用SQL管理HBase的表。

用例4HBase的一个平台


应用程序可以在HBase的顶部使用它作为数据存储上运行。例子包括Phoenix OpenTSDBKIJITitan应用程序也可以集成HBase的例子包括HivePigSolrStormFlumeImpalaSparkGangliaDrill

接下来的步骤


获取HDInsight开始使用HBase的用Hadoop

提供HDInsight集群在Azure虚拟网络

HBase的HDInsight分析Twitter的感悟

使用Maven构建使用HBase的HDInsight Java应用程序Hadoop的

C#HBase的SDK

另请参见


Apache的HBase

Bigtable的分布式存储系统结构化数据

 

本文翻译自Windows Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/

 转载请注明出处:http://blog.csdn.net/yangzhenping, 谢谢!

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
分布式数据库 Hbase 存储
带你读《HBase原理与实践》之一:HBase概述
Apache HBase是基于Apache Hadoop构建的一个高可用、高性能、多版本的分布式NoSQL数据库,是Google BigTable的开源实现,通过在廉价服务器上搭建大规模结构化存储集群,提供海量数据高性能的随机读写能力。
|
分布式数据库 Hbase 存储
|
4月前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
82 0
|
8月前
|
SQL 分布式计算 Hadoop
Hadoop集群hbase的安装
Hadoop集群hbase的安装
141 0
|
4月前
|
分布式计算 Hadoop 关系型数据库
Hadoop任务scan Hbase 导出数据量变小分析
Hadoop任务scan Hbase 导出数据量变小分析
53 0
|
3月前
|
存储 分布式计算 Hadoop
Hadoop中的HBase是什么?请解释其作用和用途。
Hadoop中的HBase是什么?请解释其作用和用途。
40 0
|
4月前
|
SQL 分布式计算 Hadoop
Hadoop学习笔记(HDP)-Part.16 安装HBase
01 关于HDP 02 核心组件原理 03 资源规划 04 基础环境配置 05 Yum源配置 06 安装OracleJDK 07 安装MySQL 08 部署Ambari集群 09 安装OpenLDAP 10 创建集群 11 安装Kerberos 12 安装HDFS 13 安装Ranger 14 安装YARN+MR 15 安装HIVE 16 安装HBase 17 安装Spark2 18 安装Flink 19 安装Kafka 20 安装Flume
82 1
Hadoop学习笔记(HDP)-Part.16 安装HBase
|
8月前
|
分布式计算 Hadoop 分布式数据库
开机时监听Hadoop和Zookpeer启动之后再启动Hbase
开机时监听Hadoop和Zookpeer启动之后再启动Hbase
|
8月前
|
存储 分布式计算 Hadoop
Hadoop之Hbase安装和配置
Hadoop之Hbase安装和配置
721 0