本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第3章,第3.6节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.6本章小结
在这一章中,我们开始使用Hadoop平台。学习了如何使用虚拟机来安装Hadoop开发环境,并且开发了第一个Hadoop程序。诚然,程序很简单,但是通过这些简单的程序学习了Hadoop平台上各种复杂的概念。
我们学习了Hadoop平台上的各种配置选项,以及配置一个Hadoop作业的方法。熟悉了Hadoop平台中用来配置作业的一组类和可高度自定义的I/O格式。最后,本章通过一个例子展示了如何将一组函数库文件从客户端传输到Hadoop集群中不同的远程节点上。