Hadoop04【集群环境搭建】

简介: Hadoop04【集群环境搭建】


 因为伪分布式环境搭建没啥意义,所以我们直接来搭建hadoop的集群环境,

一、安装文件

1.下载文件

链接:https://pan.baidu.com/s/1OXiW1i3gD6fVvrFX7NXsJg 提取码:nyzk

下载内容包括源文件和编译的文件。

2.上传解压缩

 文件上传在/root/apps/目录下.解压缩并重命名

image.png

进入hadoop目录中

image.png

目录结构介绍

image.png

二、修改配置文件

 hadoop配置文件存放在etc/hadoop文件夹下,

image.png

1.hadoop-env.sh

 设置具体的jdk路径,路径需要写死,因为在集群环境中通过$JDK_HOME获取不到系统环境变量中的信息。

image.png

2.core-site.xml

 指定NameNode的地址和hadoop运行时产生文件的存储目录。

    <!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
    <property>
          <name>fs.defaultFS</name>
          <value>hdfs://hadoop-node01:9000</value>
    </property>
    <!-- 指定hadoop运行时产生文件的存储目录 -->
    <property>
            <name>hadoop.tmp.dir</name>
            <value>/root/apps/hadoop/hdfsdata</value>
    </property>

3.hdfs-site.xml

 指定副本的存储个数,及secondaryNameNode的存储地址

  <!-- 指定HDFS副本的数量 -->
  <property>
        <name>dfs.replication</name>
        <value>1</value>
  </property>
  <!--指定secondaryNameNode的地址 -->
  <property>
        <name>dfs.secondary.http.address</name>
        <value>hadoop-node01:50090</value>
  </property>

4.mapred-site.xml

 首先需要将文件名称修改了。原文件名称为mapred-site.xml.template。指定MapReduce的资源调度方式为yarn。


image.png

 

        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>

5.yarn-site.xml

 指定ResourceManager(yarn的老大)的地址和reduce获取数据的方式shuffle。

 

        <!-- 指定YARN的老大(ResourceManager)的地址 -->
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>hadoop-node01</value>
        </property>
        <!-- reducer获取数据的方式 -->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>

6.slaves

 指定DataNode的地址。

image.png

三、内容分发

 在hadoop-node01节点配置完成后,我们可以一次性将hadoop文件夹分发给其他几个节点。

 scp -r hadoop hadoop-node02:/root/apps/
 scp -r hadoop hadoop-node03:/root/apps/
 scp -r hadoop hadoop-node04:/root/apps/

image.png

四、环境变量配置

 配置hadoop的环境变量,便于操作。

export HADOOP_HOME=/root/apps/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

image.png

其他几个节点分发或者配置下

source /etc/profile

五、HDFS格式化

 只需要在NameNode的节点上面格式化一次就可以了

hadoop namenode -format

image.png

注意只需要格式一次,在nameNode上格式化。

image.png

六、启动hdfs

 在hadoop-node01上执行

start-dfs.sh

image.png

其他节点jps查看启动情况

image.png

测试:http://192.168.88.61:50070

image.png

image.png

启动成功~


相关文章
|
1月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
162 6
|
1月前
|
分布式计算 Hadoop Shell
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
71 4
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
33 3
|
1月前
|
分布式计算 Hadoop Shell
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
58 3
|
1月前
|
SQL 存储 分布式计算
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
45 3
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
69 3
|
1月前
|
分布式计算 资源调度 Hadoop
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
98 3
|
1月前
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(二)
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(二)
43 3
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
47 2
|
1月前
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
60 2
下一篇
无影云桌面