本节书摘来自华章社区《Hadoop大数据分析与挖掘实战》一书中的第2章,第2.5节小结,作者张良均 樊哲 赵云龙 李成华 ,更多章节内容可以访问云栖社区“华章社区”公众号查看
2.5 小结
本章从介绍大数据基础概念讲起,引入了Hadoop大数据处理平台,简要介绍了Hadoop以及Hadoop生态系统。接着,详细介绍了使用VMware虚拟机搭建分布式Hadoop集群环境的步骤,使读者可以根据搭建步骤一步步来搭建自己的集群,方便后面的学习实验。然后,介绍了Hadoop的各个模块,包括Hadoop HDFS文件系统、Hadoop MapReduce编程框架、Hadoop YARN资源管理和分配器的原理。最后,给出了详细设计的实验,可以使读者在了解原理的前提下,动手实践,加深对原理的认识和理解。