《MapReduce 2.0源码分析与编程实战》一第2章 入门-阿里云开发者社区

开发者社区> 数据库> 正文

《MapReduce 2.0源码分析与编程实战》一第2章 入门

简介:

本节书摘来异步社区c书中的第2章,第2.1节,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。

第2章 入门

HBase实战
本章涵盖的内容

  • 连接到HBase和定义表
  • 与HBase交互的基本命令
  • HBase的物理数据模型和逻辑数据模型
  • 基于复合行键的查询

下面几章的一个目标是教你如何使用HBase。作为一名应用开发人员,首先你要适应HBase的特性。你将学习HBase的逻辑数据模型(logical data model),访问HBase的各种方式,以及如何使用这些API的细节。另外一个目标是教你进行HBase模式(schema)设计。HBase有着和以往关系型数据库不同的物理数据模型(physical data model)。我们将介绍一些HBase物理模型的基本原理,以便设计数据模型时你能够利用它对自已的应用系统进行优化。

为了完成这些目标,你将从头开始搭建一个应用系统。请允许我们给你介绍一下完全建立在HBase上的TwitBase,它是社交网络Twitter的简化克隆版。我们不会实现Twitter的所有功能,而且这也不是一个准备投入使用的系统。我们只是把TwitBase看做Twitter的初级原型产品。TwitBase和Twitter早期版本的主要区别是,TwitBase设计中考虑了可扩展性,因此需要依赖数据存储来实现这一点。

本章从基本原理开始讲起。你会看到如何创建HBase表,如何导入数据和读取数据。我们将介绍HBase处理数据的基本操作,以及数据模型的基本组件。同时,你会学到一些HBase的内部工作机制。这些知识可以帮助你在模式设计时作出正确决定。本章是学习HBase和其余章节的起点。

要获取本章及全书的代码,请访问 https://github.com/hbaseinaction/twitbase

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
数据库
使用钉钉扫一扫加入圈子
+ 订阅

分享数据库前沿,解构实战干货,推动数据库技术变革

其他文章