hadoop 2.7.2 + zookeeper 高可用集群部署

本文涉及的产品
云原生网关 MSE Higress,422元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: 一.环境说明 虚拟机:vmware 11 操作系统:Ubuntu 16.04 Hadoop版本:2.7.2 Zookeeper版本:3.4.9 二.节点部署说明 三.Hosts增加配置 sudo gedit /etc/hosts wxzz-pc、wxzz-pc0、wxzz-pc1、wxzz-pc2均配置如下: 127.

一.环境说明

虚拟机:vmware 11

操作系统:Ubuntu 16.04

Hadoop版本:2.7.2

Zookeeper版本:3.4.9

二.节点部署说明

三.Hosts增加配置

sudo gedit /etc/hosts

wxzz-pc、wxzz-pc0、wxzz-pc1、wxzz-pc2均配置如下:

127.0.0.1 localhost
192.168.72.132 wxzz-pc
192.168.72.138 wxzz-pc0
192.168.72.135 wxzz-pc1
192.168.72.136 wxzz-pc2

 四.zookeeper上配置

Zoo.cfg配置文件内容如下:

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/opt/zookeeper-3.4.9/tmp/dataDir
dataLogDir=/opt/zookeeper-3.4.9/tmp/logs/
clientPort=2181
server.1=wxzz-pc:2182:2183
server.2=wxzz-pc0:2182:2183
server.3=wxzz-pc1:2182:2183

 在/opt/zookeeper-3.4.9/tmp/dataDir下新建”myid”文件,wxzz-pc、wxzz-pc0、wxzz-pc1三台虚拟机中myid文件分别对应的内容为:1、2、3,也就是server.X=wxzz-pc:2182:2183,对应X的数值。

五.Hadoop配置

1.core-site.xml 配置

<configuration>
        <property>
           <name>fs.defaultFS</name>
           <value>hdfs://myhadoop:8020</value>
        </property>
        <property>
           <name>hadoop.tmp.dir</name>
           <value>/opt/hadoop-2.7.2/tmp/hadoop-${user.name}</value>
        </property>
        <property>
           <name>ha.zookeeper.quorum</name>
           <value>wxzz-pc:2181,wxzz-pc0:2181,wxzz-pc1:2181</value>
        </property>
</configuration>

2. hdfs-site.xml 配置

<configuration>
     <property>
        <name>dfs.replication</name>
        <value>2</value>
     </property>
     <property> 
         <name>dfs.block.size</name> 
         <value>10485760</value> 
     </property>
     <property>
       <name>hadoop.tmp.dir</name>
       <value>/opt/hadoop-2.7.2/tmp/hadoop-${user.name}</value>
     </property>
     <property>
       <name>dfs.namenode.name.dir</name>
       <value>${hadoop.tmp.dir}/dfs/name</value>
     </property>
    <property>
       <name>dfs.datanode.data.dir</name>
       <value>${hadoop.tmp.dir}/dfs/data</value>
     </property>
     <property> 
         <name>dfs.permissions</name> 
         <value>false</value> 
     </property> 
     <property> 
        <name>dfs.permissions.enabled</name> 
        <value>false</value> 
     </property> 
     <property>   
       <name>dfs.webhdfs.enabled</name>   
       <value>true</value>   
    </property>
     <property>
       <name>dfs.nameservices</name>
       <value>myhadoop</value>
     </property>
     <property>
       <name>dfs.ha.namenodes.myhadoop</name>
       <value>nn1,nn2</value>
     </property>
     <property>
       <name>dfs.namenode.rpc-address.myhadoop.nn1</name>
       <value>wxzz-pc:8020</value>
     </property>
     <property>
       <name>dfs.namenode.http-address.myhadoop.nn1</name>
       <value>wxzz-pc:50070</value>
     </property>
      <property>
       <name>dfs.namenode.rpc-address.myhadoop.nn2</name>
       <value>wxzz-pc0:8020</value>
     </property>
    <property>
       <name>dfs.namenode.http-address.myhadoop.nn2</name>
       <value>wxzz-pc0:50070</value>
     </property>
    <property>
        <name>dfs.namenode.servicerpc-address.myhadoop.nn1</name>
        <value>wxzz-pc:53310</value>
     </property>
     <property>
        <name>dfs.namenode.servicerpc-address.cluster1.nn2</name>
        <value>wxzz-pc0:53310</value>
     </property>
     <property>
        <name>dfs.ha.automatic-failover.enabled.cluster1</name>
        <value>true</value>
     </property>
     <property>
            <name>dfs.namenode.shared.edits.dir</name>
             <value>qjournal://wxzz-pc:8485;wxzz-pc0:8485;wxzz-pc1:8485/myhadoop</value>
     </property>
    <property>
        <name>dfs.client.failover.proxy.provider.myhadoop</name>  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
     </property>
     <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/hadoop-2.7.2/journal</value>
     </property>
     <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
     </property>
     <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/opt/hadoop-2.7.2/.ssh/id_rsa</value>
     </property>
    <property>
       <name>dfs.ha.fencing.ssh.connect-timeout</name>
       <value>1000</value>
     </property>
     <property>
       <name>dfs.namenode.handler.count</name>
       <value>10</value>
     </property>
    <property>
       <name>dfs.ha.automatic-failover.enabled.myhadoop</name>
       <value>true</value>
     </property>
</configuration>

3. mapred-site.xml 配置

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
      <name>mapreduce.jobhistory.address</name>
      <value>0.0.0.0:10020</value>
    </property>
    <property>
      <name>mapreduce.jobhistory.webapp.address</name>
      <value>0.0.0.0:19888</value>
    </property>
</configuration>

4.yarn-site.xml 配置

<configuration>
        <property>
           <name>yarn.resourcemanager.ha.enabled</name>
           <value>true</value>
        </property>
        <property>
           <name>yarn.resourcemanager.cluster-id</name>
           <value>rm-id</value>
        </property>
        <property>
           <name>yarn.resourcemanager.ha.rm-ids</name>
           <value>rm1,rm2</value>
        </property>
        <property>
           <name>yarn.resourcemanager.hostname.rm1</name>
           <value>wxzz-pc</value>
        </property>
        <property>
           <name>yarn.resourcemanager.hostname.rm2</name>
           <value>wxzz-pc0</value>
        </property>
        <property>
           <name>yarn.resourcemanager.zk-address</name>
           <value>wxzz-pc:2181,wxzz-pc0:2181,wxzz-pc1:2181</value>
        </property>
        <property>
           <name>yarn.nodemanager.aux-services</name>
           <value>mapreduce_shuffle</value>
        </property>
</configuration>

六.服务启动

1.在各个Journal Node节点上,输入以下命令启动Journal Node

         sbin/hadoop-daemon.sh start journalnode

2.在[nn1]上,进行格式化,并启动

         bin/hdfs namenode -format

         sbin/hadoop-daemon.sh start namenode

3.在[nn2]上,同步[nn1]的元数据信息,并启动

         bin/hdfs namenode -bootstrapStandby

         sbin/hadoop-daemon.sh start namenode

   经过以上3步,[nn1]和[nn2]均处在standby状态

4.[nn1]节点上,将其转换为active状态

         bin/hdfs haadmin –transitionToActive --forcemanual nn1

5.在[nn1]上,启动所有datanode

         sbin/hadoop-daemons.sh start datanode

6.在[nn1]上,启动yarn

         sbin/start-yarn.sh

如果要关闭集群,在[nn1]上输入sbin/stop-all.sh即可。以后每次启动的时候,需要按照上面的步骤启动,不过不需要执行2 的格式化操作。

七.运行效果

管理界面:

 

命令行效果:

 


1.[连载]《C#通讯(串口和网络)框架的设计与实现》

2.[开源]C#跨平台物联网通讯框架ServerSuperIO(SSIO)介绍

2.应用SuperIO(SIO)和开源跨平台物联网框架ServerSuperIO(SSIO)构建系统的整体方案

3.C#工业物联网和集成系统解决方案的技术路线(数据源、数据采集、数据上传与接收、ActiveMQ、Mongodb、WebApi、手机App)

5.ServerSuperIO开源地址:https://github.com/wxzz/ServerSuperIO

物联网&集成技术(.NET) QQ群54256083 

 

相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
19天前
|
分布式计算 资源调度 Hadoop
【赵渝强老师】基于ZooKeeper实现Hadoop HA
本文介绍了如何在4个节点(bigdata112、bigdata113、bigdata114和bigdata115)上部署HDFS高可用(HA)架构,并同时部署Yarn的HA。详细步骤包括环境变量设置、配置文件修改、ZooKeeper集群启动、JournalNode启动、HDFS格式化、ZooKeeper格式化以及启动Hadoop集群等。最后通过jps命令检查各节点上的后台进程,确保部署成功。
|
2月前
|
分布式计算 NoSQL Java
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
45 2
|
2月前
|
分布式计算 负载均衡 算法
Hadoop-31 ZooKeeper 内部原理 简述Leader选举 ZAB协议 一致性
Hadoop-31 ZooKeeper 内部原理 简述Leader选举 ZAB协议 一致性
30 1
|
2月前
|
分布式计算 Java Hadoop
Hadoop-30 ZooKeeper集群 JavaAPI 客户端 POM Java操作ZK 监听节点 监听数据变化 创建节点 删除节点
Hadoop-30 ZooKeeper集群 JavaAPI 客户端 POM Java操作ZK 监听节点 监听数据变化 创建节点 删除节点
67 1
|
2月前
|
分布式计算 监控 Hadoop
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
43 1
|
2月前
|
分布式计算 Hadoop Unix
Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制
Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制
45 1
|
2月前
|
分布式计算 Hadoop
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
50 1
|
2月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
167 6
|
2月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
68 2
|
27天前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第27天】在大数据时代,数据湖技术凭借其灵活性和成本效益成为企业存储和分析大规模异构数据的首选。Hadoop和Spark作为数据湖技术的核心组件,通过HDFS存储数据和Spark进行高效计算,实现了数据处理的优化。本文探讨了Hadoop与Spark的最佳实践,包括数据存储、处理、安全和可视化等方面,展示了它们在实际应用中的协同效应。
86 2