【Hadoop】完全分布模式

简介: 完全分布模式

实验环境:

三台CentOS7jdk1.8hadoop2.7.3

Server1: 192.168.200.10

Server2: 192.168.200.11

Server3: 192.168.200.12

 

三个节点安装好java包,配置jdk环境变量

image.png

 

#配置JAVA路径环境变量

[root@server1 hadoop]# vim hadoop-env.sh 
export JAVA_HOME=/opt/jdk1.8.0_161/

 

hadoop包放到主节点上,解压到/opt

修改配置四个文件

######################################

[root@server1 hadoop]# vim core-site.xml 
<configuration>
<property>
 <name>fs.default.name</name>        #配置文件系统hdfs
 <value>hdfs://server1:9000</value>
</property>
<property>
 <name>hadoop.tmp.dir</name>        #namenode地址
 <value>/opt/hadoop-2.7.3/hdfs/tmp</value>    #临时文件的存放目录
</property>
</configuration>

 

######################################

[root@server1 hadoop]# vim hdfs-site.xml 
<configuration>
<property>
 <name>dfs.replication</name>        #hdfs副本数量
  <value>3</value>
</property>
<property>
 <name>dfs.name.dir</name>          #存储namenode的路径
 <value>/opt/hadoop-2.7.3/hdfs/name</value>
</property>
<property>
 <name>dfs.data.dir</name>           #存储上传数据的路径
 <value>/opt/hadoop-2.7.3/hdfs/data</value>
</property>
<property>
 <name>dfs.permission</name>    #设置false不检查权限
  <value>false</value>
</property>
</configuration>

 

######################################

[root@server1 hadoop]# cp mapred-site.xml.template mapred-site.xml
[root@server1 hadoop]# vim mapred-site.xml
<configuration>
<property>
 <name>mapreduce.framework.name</name>  #配置mapreduce运行框架,由yarn平台运行负责分配内存
  <value>yarn</value>
</property>
</configuration>

 

######################################

[root@server1 hadoop]# vim yarn-site.xml 
<?xml version="1.0"?>
<configuration>
<property>
 <name>yarn.resourcemanager.hostname</name>  #指定yarn的resourcemanager地址
  <value>server1</value>
</property>
<property>
 <name>yarn.nodemanager.aux-services</name>   #reducer获取数据方式
  <value>mapreduce_shuffle</value>
</property>
<property>
 <name>yarn.nodemanager.vmem-check-enabled</name>  #忽略虚拟内存检查,若物理机内存足够可不加
  <value>false</value>
</property>
</configuration>

 

 

编辑slaves,删除localhost,加入从节点主机名

[root@server1 hadoop]# vim slaves 
server2
server3

 

hdfs格式化

image.png

 

格式化成功

image.png

 

检查配置的hdfs目录中有没有出现文件

image.png

 

启动所有节点,在主节点中输入jps检查,启动了三个进程

[root@server1 sbin]# ./start-all.sh

image.png

 

在第二个的从节点,启动了两个进程

image.png

 

在第三个的从节点,启动了两个进程

image.png

 

浏览器访问主节点的http://ip:50070端口

image.png

 

image.png

相关文章
|
2月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
195 6
|
2月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
83 2
|
6月前
|
分布式计算 Hadoop Shell
Hadoop数据重分布
【6月更文挑战第13天】
73 3
|
1月前
|
分布式计算 资源调度 Hadoop
【赵渝强老师】部署Hadoop的本地模式
本文介绍了Hadoop的目录结构及本地模式部署方法,包括解压安装、设置环境变量、配置Hadoop参数等步骤,并通过一个简单的WordCount程序示例,演示了如何在本地模式下运行MapReduce任务。
|
2月前
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
66 2
|
4月前
|
存储 分布式计算 算法
探索Hadoop的三种运行模式:单机模式、伪分布式模式和完全分布式模式
在配置Hadoop集群之前,了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况,选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段,单机模式和伪分布式模式能为用户提供便利和成本效益。进而,当用户要处理大规模数据集时,完全分布式模式将是理想的选择。
303 2
|
4月前
|
分布式计算 Ubuntu Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
48 1
|
4月前
|
存储 分布式计算 Hadoop
Hadoop 运行的三种模式
【8月更文挑战第31天】
538 0
|
6月前
|
存储 分布式计算 Hadoop
Hadoop数据重分布的原因
【6月更文挑战第16天】
55 9
Hadoop数据重分布的原因
|
6月前
|
分布式计算 Hadoop
Hadoop数据重分布的逻辑流程
【6月更文挑战第16天】
50 8

相关实验场景

更多