《深入理解Hadoop(原书第2版)》——3.6本章小结

简介:

本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第3章,第3.6节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.6本章小结

在这一章中,我们开始使用Hadoop平台。学习了如何使用虚拟机来安装Hadoop开发环境,并且开发了第一个Hadoop程序。诚然,程序很简单,但是通过这些简单的程序学习了Hadoop平台上各种复杂的概念。

我们学习了Hadoop平台上的各种配置选项,以及配置一个Hadoop作业的方法。熟悉了Hadoop平台中用来配置作业的一组类和可高度自定义的I/O格式。最后,本章通过一个例子展示了如何将一组函数库文件从客户端传输到Hadoop集群中不同的远程节点上。

相关文章
|
XML 分布式计算 Hadoop
hadoop
hadoop
1112 0
|
4月前
|
分布式计算 资源调度 Hadoop
Hadoop 2.0 与 Hadoop 1.x 有何不同?
【8月更文挑战第12天】
106 4
|
分布式计算 资源调度 Hadoop
02 Hadoop介绍
02 Hadoop介绍
52 0
|
机器学习/深度学习 存储 SQL
Hadoop
Hadoop组成
209 0
|
SQL 数据采集 分布式计算
Hadoop01【介绍】
HADOOP是apache旗下的一套开源软件平台,HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理
Hadoop01【介绍】
|
存储 分布式计算 大数据
|
分布式计算 监控 Hadoop
|
分布式计算 Java Hadoop
|
分布式计算 Java Hadoop