本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第2章,第2.6节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.6本章小结
本章介绍了Hadoop系统的各种概念。从一个典型的单词计数程序示例开始,一步步地介绍了Hadoop系统的各种特性。介绍了Hadoop分布式文件系统(HDFS),介绍了Hadoop1.x系统中是如何通过作业跟踪器守护进程和任务跟踪器守护进程来管理作业的。认识到了这些守护进程限制了系统的可扩展性之后,我们引入了YARN的讲解。YARN是Hadoop2.x系统的重要特性,解决了系统扩展性的问题。最后,我们讲解了高可用名称节点。
下面的章节,我们会介绍Hadoop系统的安装,还会教你编写和执行自己的第一个MapReduce程序。