实验环境:
三台CentOS7,jdk1.8,hadoop2.7.3
Server1: 192.168.200.10
Server2: 192.168.200.11
Server3: 192.168.200.12
三个节点安装好java包,配置jdk环境变量
#配置JAVA路径环境变量
[root@server1 hadoop]# vim hadoop-env.sh export JAVA_HOME=/opt/jdk1.8.0_161/
将hadoop包放到主节点上,解压到/opt
修改配置四个文件
######################################
[root@server1 hadoop]# vim core-site.xml <configuration> <property> <name>fs.default.name</name> #配置文件系统hdfs <value>hdfs://server1:9000</value> </property> <property> <name>hadoop.tmp.dir</name> #namenode地址 <value>/opt/hadoop-2.7.3/hdfs/tmp</value> #临时文件的存放目录 </property> </configuration>
######################################
[root@server1 hadoop]# vim hdfs-site.xml <configuration> <property> <name>dfs.replication</name> #hdfs副本数量 <value>3</value> </property> <property> <name>dfs.name.dir</name> #存储namenode的路径 <value>/opt/hadoop-2.7.3/hdfs/name</value> </property> <property> <name>dfs.data.dir</name> #存储上传数据的路径 <value>/opt/hadoop-2.7.3/hdfs/data</value> </property> <property> <name>dfs.permission</name> #设置false不检查权限 <value>false</value> </property> </configuration>
######################################
[root@server1 hadoop]# cp mapred-site.xml.template mapred-site.xml [root@server1 hadoop]# vim mapred-site.xml <configuration> <property> <name>mapreduce.framework.name</name> #配置mapreduce运行框架,由yarn平台运行负责分配内存 <value>yarn</value> </property> </configuration>
######################################
[root@server1 hadoop]# vim yarn-site.xml <?xml version="1.0"?> <configuration> <property> <name>yarn.resourcemanager.hostname</name> #指定yarn的resourcemanager地址 <value>server1</value> </property> <property> <name>yarn.nodemanager.aux-services</name> #reducer获取数据方式 <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.vmem-check-enabled</name> #忽略虚拟内存检查,若物理机内存足够可不加 <value>false</value> </property> </configuration>
编辑slaves,删除localhost,加入从节点主机名
[root@server1 hadoop]# vim slaves server2 server3
hdfs格式化
格式化成功
检查配置的hdfs目录中有没有出现文件
启动所有节点,在主节点中输入jps检查,启动了三个进程
[root@server1 sbin]# ./start-all.sh
在第二个的从节点,启动了两个进程
在第三个的从节点,启动了两个进程
浏览器访问主节点的http://ip:50070端口