Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程）（二）-阿里云开发者社区

Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程）（二）

2024-08-26 313

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程）（二）

Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程）（一）：https://developer.aliyun.com/article/1597085

3. 配置`yarn-site.xml`

编辑$HADOOP_HOME/etc/hadoop/yarn-site.xml：

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

4. 配置`mapred-site.xml`

复制默认模板并进行修改：

cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml

编辑mapred-site.xml：

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

5. 配置`slaves`文件

编辑$HADOOP_HOME/etc/hadoop/slaves文件，列出所有DataNode节点：

slave1
slave2

6. 分发配置文件到所有节点

将配置好的Hadoop文件夹分发到所有节点：

scp -r /usr/local/hadoop slave1:/usr/local/
scp -r /usr/local/hadoop slave2:/usr/local/

五、启动Hadoop集群

1. 格式化HDFS

在master节点上运行以下命令来格式化HDFS：

hdfs namenode -format

2. 启动HDFS和YARN

依次启动HDFS和YARN服务：

start-dfs.sh
start-yarn.sh

3. 验证集群状态

启动Hadoop之后，可以通过Web界面查看集群状态：

NameNode UI: http://master:9870
ResourceManager UI: http://master:8088

4. 验证节点连通性

在master节点上，执行以下命令以检查节点状态：

hdfs dfsadmin -report
yarn node -list

六、测试集群

运行Hadoop提供的示例程序，验证集群是否正常工作：

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /input /output

验证输出结果

查看生成的结果文件：

hdfs dfs -cat /output/part-r-00000

七、总结

本文涵盖了从设置主机名、配置SSH免密登录、安装Java环境到Hadoop配置与启动的详细步骤。通过这些步骤，你可以成功搭建一个Hadoop集群，为大数据学习和实际应用打下坚实的基础。下一步，你可以尝试

配置高可用性或对集群进行性能优化。

八、附录

分发脚本

#!/bin/bash
 
if [ $# -lt 1 ]
then
  echo Not Enough Arguemnet!
  exit;
fi
 
for host in 10.0.13.239 10.0.13.253 10.0.13.196
do
  echo =============== $host =================
  for file in $@
  do 
    if [ -e $file ]
      then
        pdir=$(cd -P $(dirname $file); pwd)
        fname=$(basename $file)
        ssh -p 36000 $host "mkdir -p $pdir"
        rsync  -e 'ssh -p 36000' -av $pdir/$fname $host:$pdir
      else
        echo $file does not exists!
    fi
  done
done

Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程）（二）

3. 配置`yarn-site.xml`

4. 配置`mapred-site.xml`

5. 配置`slaves`文件

6. 分发配置文件到所有节点

五、启动Hadoop集群

1. 格式化HDFS

2. 启动HDFS和YARN

3. 验证集群状态

4. 验证节点连通性

六、测试集群

验证输出结果

七、总结

八、附录

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程）（二）

3. 配置yarn-site.xml

4. 配置mapred-site.xml

5. 配置slaves文件

6. 分发配置文件到所有节点

五、启动Hadoop集群

1. 格式化HDFS

2. 启动HDFS和YARN

3. 验证集群状态

4. 验证节点连通性

六、测试集群

验证输出结果

七、总结

八、附录

热门文章

最新文章

相关课程

相关电子书

相关实验场景

3. 配置`yarn-site.xml`

4. 配置`mapred-site.xml`

5. 配置`slaves`文件