inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。
Hadoop是Apache基金会下的一个开源云计算平台项目。当前最新版本是hadoop 0.20.1。下面就hadoop 0.20.1为蓝本,介绍在Ubuntu Linux 9.10下安装hadoop的方法。
支持的平台:
Linux,可作为开发和产品部署的平台;
Windows,可作为开发平台。
事先需要的软件:
1.JavaTM1.6.x,必须安装,建议选择Sun公司发行的Java版本;
2.ssh必须安装,并保证sshd运行,hadoop将以ssh进行通讯;
3.如果是windows,则需要装Cygwin,用以支持shell命令。
安装可用的模式:
1.本地模式;
2.伪分布模式;
3.全分布模式。
伪分布模式安装步骤:
1.将hadoop安装包解压缩到某目录下;
2.修改conf/hadoop-env.sh文件,export JAVA_HOME=那行设置正确的JAVA_HOME位置
3.修改conf/core-site.xml,改为:
<configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> </configuration>
4.修改conf/hdfs-site.xml,改为:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
5.修改conf/mapred-site.xml,改为:
<configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration>
6.设置本机ssh本机无密码
先测试一下,输入命令ssh localhost,如果提示密码,则需要进行以下操作:
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
7.格式化namenode:
$ bin/hadoop namenode -format
8.启动Hadoop:
$ bin/start-all.sh
至此,hadoop伪分布模式安装完毕!