hadoop完全分布式安装配置-阿里云开发者社区

hadoop完全分布式安装配置

2017-11-15 1062

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一、创建hadoop用户并配置ssh无密钥登录。

http://yntmdr.blog.51cto.com/3829621/1631908

二、安装jdk

三、解压hadoop压缩包

tar -xf hadoop-2.7.1.tar.gz

修改拥有者

chown -R hadoop:hadoop hadoop-2.7.1

四、添加hadoop环境变量

编辑/etc/profile文件追加

HADOOP_HOME=/usr/local/hadoop-2.7.1

PATH=$PATH:$HADOOP_HOME/bin

export HADOOP_HOME PATH

保存并退出

五、使环境变量生效

source /etc/profile

执行 hadoop version 查看是否配置成功

六、修改 hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_71

七、修改yarn-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_71

八、修改slaves添加host:

hddn141

hddn142

九、修改配置文件 core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/usr/local/hadoop-2.6.0/tmp</value>

</property>

</configuration>

八、修改配置文件 hdfs-site.xml

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop-2.6.0/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop-2.6.0/dfs/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

dfs.replication配置了文件块的副本数，一般不大于从机的个数

九、修改配置文件 mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

这个是mapreduce任务的配置，由于hadoop2.x使用了yarn框架，所以要实现分布式部署，必须在mapreduce.framework.name属性下配置为yarn

十、编辑yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.admin.address</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

</configuration>

十一、由于涉及到端口较多所以我们直接关闭防火墙

systemctl stop iptables

十二、将配置好的hadoop复制到其他节点

scp -r /usr/local/hadoop-2.7.1 root@hddn141:/usr/local

scp -r /usr/local/hadoop-2.7.1 root@hddn142:/usr/local

拷贝完成后，修改所有者

chown -R hadoop:hadoop hadoop-2.7.1

十三、对hdfs格式化,执行以下命令：

hdfs namenode -format

出现

Storage directory /tmp/hadoop-hadoop/dfs/name has been successfully formatted.

搞定！

重新格式化namenode时，需先删除各节点的tmp文件

十四、启动sbin目录下

start-all.sh

十五、执行jps查看java进程

hdnn140服务器上5个进程：

Jps

16977 DataNode

29754 ResourceManager

17382 NodeManager

29447 NameNode

29620 SecondaryNameNode

hddn141服务器上2个进程：

Jps

hddn142服务器上2个进程：

Jps

十六、通过网址查看

http://192.168.152.140:8088/

完成！

说明：

1、hostname不要使用下划线。

本文转自 yntmdr 51CTO博客，原文链接：http://blog.51cto.com/yntmdr/1631956，如需转载请自行联系原作者

hadoop完全分布式安装配置

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

hadoop完全分布式安装配置

热门文章

最新文章

相关课程

相关电子书

相关实验场景