《深入理解Hadoop(原书第2版)》——2.6本章小结

简介:

本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第2章,第2.6节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.6本章小结

本章介绍了Hadoop系统的各种概念。从一个典型的单词计数程序示例开始,一步步地介绍了Hadoop系统的各种特性。介绍了Hadoop分布式文件系统(HDFS),介绍了Hadoop1.x系统中是如何通过作业跟踪器守护进程和任务跟踪器守护进程来管理作业的。认识到了这些守护进程限制了系统的可扩展性之后,我们引入了YARN的讲解。YARN是Hadoop2.x系统的重要特性,解决了系统扩展性的问题。最后,我们讲解了高可用名称节点。

下面的章节,我们会介绍Hadoop系统的安装,还会教你编写和执行自己的第一个MapReduce程序。

相关文章
|
3月前
|
分布式计算 资源调度 Hadoop
Hadoop 2.0 与 Hadoop 1.x 有何不同?
【8月更文挑战第12天】
72 4
|
3月前
|
存储 分布式计算 Hadoop
深入理解Hadoop中的SequenceFileInputFormat
【8月更文挑战第31天】
74 0
|
分布式计算 资源调度 Java
Hadoop3.2.0使用详解
Hadoop3.2.0使用详解1.概述Hadoop3已经发布很久了,迭代集成的一些新特性也是很有用的。截止本篇博客书写为止,Hadoop发布了3.2.0。接下来,笔者就为大家分享一下在使用Hadoop3中遇到到一些问题,以及解决方法。
3597 0
|
分布式计算 监控 Hadoop
|
分布式计算 Java Hadoop
|
分布式计算 NoSQL 大数据
|
分布式计算 算法 大数据
|
存储 分布式计算 大数据

相关实验场景

更多