前 言
MapReduce设计模式
欢迎阅读《MapReduce设计模式》!这是一本既独特又熟悉的书。首先,这显然是一本关于设计模式的书,为大家提供解决问题的模板或通用指南。我们看了一些以前出版的有关设计模式的书,特别是Gamma等人(1995)编著的《Design Patterns: Elements of Reusable Object-Oriented Software》(通常被成为“四人组”书),从中汲取了灵感。在每个模式的描述中,读者都会看到一个我们反复使用的模板,这个模板基本是基于他们这本书的。重复看到类似的模板可以帮助读者获取所需的特定信息。这在以后使用这本书当参考书时特别有用。
这本书相对于“cookbook”类的书要更开放一些,因为本书不是面向解决具体问题的。但与cookbook类的书相似的是,本书涉及的内容同样都是简短的、分门别类的。要解决你所面临的问题需要付出比复制、粘贴我们的代码更多的努力,但是我们希望你可以找到一个模式帮助你解决掉90%的问题。
这本书主要是关于Hadoop或MapReduce的数据分析层面的。我们特意尽量不去引入过多有关Hadoop或MapReduce如何工作的细节,也没有长篇大论地说明我们使用的API。这些主题在互联网和相关出版物中已经有不少的涉及,因此我们决定把重点放在分析上。
考虑到在风格上与其他书籍有所不同,所以我们将在前言里说明如何更好地阅读本书。
目 录
第1章 设计模式与MapReduce
1.1 设计模式
1.2 MapReduce简史
1.3 MapReduce和Hadoop简介
1.4 Hadoop示例:单词计数
1.5 Pig和Hive
第2章 概要模式
第3章 过滤模式
第4章 数据组织模式
第5章 连接模式
第6章 元模式
第7章 输入和输出模式
第8章 最后的思考与设计模式的未来