《MapReduce 2.0源码分析与编程实战》一第2章 入门

简介:

本节书摘来异步社区c书中的第2章,第2.1节,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。

第2章 入门

HBase实战
本章涵盖的内容

  • 连接到HBase和定义表
  • 与HBase交互的基本命令
  • HBase的物理数据模型和逻辑数据模型
  • 基于复合行键的查询

下面几章的一个目标是教你如何使用HBase。作为一名应用开发人员,首先你要适应HBase的特性。你将学习HBase的逻辑数据模型(logical data model),访问HBase的各种方式,以及如何使用这些API的细节。另外一个目标是教你进行HBase模式(schema)设计。HBase有着和以往关系型数据库不同的物理数据模型(physical data model)。我们将介绍一些HBase物理模型的基本原理,以便设计数据模型时你能够利用它对自已的应用系统进行优化。

为了完成这些目标,你将从头开始搭建一个应用系统。请允许我们给你介绍一下完全建立在HBase上的TwitBase,它是社交网络Twitter的简化克隆版。我们不会实现Twitter的所有功能,而且这也不是一个准备投入使用的系统。我们只是把TwitBase看做Twitter的初级原型产品。TwitBase和Twitter早期版本的主要区别是,TwitBase设计中考虑了可扩展性,因此需要依赖数据存储来实现这一点。

本章从基本原理开始讲起。你会看到如何创建HBase表,如何导入数据和读取数据。我们将介绍HBase处理数据的基本操作,以及数据模型的基本组件。同时,你会学到一些HBase的内部工作机制。这些知识可以帮助你在模式设计时作出正确决定。本章是学习HBase和其余章节的起点。

要获取本章及全书的代码,请访问 https://github.com/hbaseinaction/twitbase

相关文章
|
分布式计算 资源调度 大数据
黑马程序员-大数据入门到实战-MapReduce & YARN入门
黑马程序员-大数据入门到实战-MapReduce & YARN入门
402 0
|
缓存 分布式计算 资源调度
MapReduce入门(一篇就够了)
MapReduce入门(一篇就够了)
10776 1
MapReduce入门(一篇就够了)
|
分布式计算 资源调度 Java
MapReduce入门(一篇就够了)(下)
MapReduce入门(一篇就够了)(下)
1033 0
|
存储 分布式计算 大数据
大数据MapReduce入门
大数据MapReduce入门
272 0
|
分布式计算 算法 Java
MapReduce入门编程-成绩求和排序
MapReduce入门编程-成绩求和排序
MapReduce入门编程-成绩求和排序
|
缓存 分布式计算
MapReduce执行机制之Map和Reduce源码分析
MapReduce执行机制之Map和Reduce源码分析
457 0
MapReduce执行机制之Map和Reduce源码分析
|
分布式计算 Java Hadoop
java:MapReduce原理及入门实例:wordcount
java:MapReduce原理及入门实例:wordcount
355 0
java:MapReduce原理及入门实例:wordcount
|
资源调度 分布式计算 Java
MapReduce入门例子之WordCount单词计数
MapReduce入门例子之WordCount单词计数
333 0
MapReduce入门例子之WordCount单词计数
|
存储 分布式计算 druid
【Druid】(七)E-MapReduce 增强型 Druid 入门1
【Druid】(七)E-MapReduce 增强型 Druid 入门1
487 0
【Druid】(七)E-MapReduce 增强型 Druid 入门1
|
存储 分布式计算 Hadoop
Hadoop之MapReduce04【客户端源码分析】
客户端源码分析 启动的客户端代码 public static void main(String[] args) throws Exception { // 创建配置文件对象 Configuration conf = new Configuration(true); // 获取Job对象 Job job = Job.getInstance(conf); // 设置相关类 job.setJarByClass(WcTest.class);
Hadoop之MapReduce04【客户端源码分析】

热门文章

最新文章