搭建高可用Hadoop集群

本文涉及的产品
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
简介: 搭建高可用Hadoop集群

文章目录

1.架构

前边已经搭建过单节点的hadoop,一旦出现NameNode机器出现了宕机,整个服务就不可用。一个很经典的模式HA集群,两个或则两个以上的集群机器配置NameNode,任意一个时刻,只有一个NameNode处于Active State,其他的处于Standby state状态,激活状态的NameNode负责所有客户端在集群的操作。

2.集群准备工作

需要安置单节点基础准备进行配置基础环境。

1)jdk配置

本地规划的4个节点,需要每台都安装Jdk1.8配置环境变量

2)ssh免密

Now check that you can ssh to the localhost without a passphrase:

 $ ssh localhost

If you cannot ssh to localhost without a passphrase, execute the following commands:

 $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

 $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

 $ chmod 0600 ~/.ssh/authorized_keys

可以将第一节点的公钥拷贝到其他节点。

3)其他的网络配置不在赘述。

3. 集群配置

1 基本配置

在单节点的基础上node01:

cd $HADOOP/etc/hadoop

vi core-site.xml 不需要改

vi hdfs-site.xml

    <property>

  <name>dfs.replication</name>

  <value>2</value>

     </property>

     <property>

  <name>dfs.namenode.name.dir</name>

  <value>/var/bigdata/hadoop/full/dfs/name</value>

     </property>

     <property>

  <name>dfs.datanode.data.dir</name>

  <value>/var/bigdata/hadoop/full/dfs/data</value>

     </property>

     <property>

  <name>dfs.namenode.secondary.http-address</name>

  <value>node02:50090</value>

     </property>

     <property>

  <name>dfs.namenode.checkpoint.dir</name>

  <value>/var/bigdata/hadoop/full/dfs/secondary</value>

     </property>

2 修改从节点

vi slaves

node02

node03

node04

3 将整个节点分发到node2,node3,node4

cd /opt

 scp -r ./bigdata/  node02:`pwd`

 scp -r ./bigdata/  node03:`pwd`

 scp -r ./bigdata/  node04:`pwd`

4 部署zookeeper

tar xf zook....tar.gz

mv zoo...    /opt/bigdata

cd /opt/bigdata/zoo....

cd conf

cp zoo_sample.cfg  zoo.cfg

vi zoo.cfg

datadir=/var/bigdata/hadoop/zk

server.1=node02:2888:3888

server.2=node03:2888:3888

server.3=node04:2888:3888

mkdir /var/bigdata/hadoop/zk

echo 1 >  /var/bigdata/hadoop/zk/myid  

其他节点也同样的操作。

5.操作流程

重点:初始化启动

1) 启动JN

hadoop-daemon.sh start journalnode  

2) 格式化NN,格式化一个集群中的节点即可

hdfs namenode -format

3) 另外的NN节点同步

hdfs namenode -bootstrapStandby

4.格式化zookeeper

hdfs zkfc  -formatZK

5.启动dfs

start-dfs.sh

6.访问页面观察信息

只有一个节点是active状态,另外一个节点是standby状态

8f61fcb38eeb475fb80fba45ad272a93.png

zookeeper节点锁信息

e001221f8a9f4b61bf578f54555ede6c.png

7 模拟active节点杀掉进程

当node01进程结束之后,node02变成active

973b02a2078d42d58b8a19031fed3970.png

zookeeper节点信息

9990c97e4d0a47eb9005086b5bf51f15.png


相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
1月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
152 6
|
1月前
|
分布式计算 Hadoop Shell
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
69 4
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
33 3
|
1月前
|
分布式计算 Hadoop Shell
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
Hadoop-36 HBase 3节点云服务器集群 HBase Shell 增删改查 全程多图详细 列族 row key value filter
57 3
|
1月前
|
SQL 存储 分布式计算
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
42 3
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
62 3
|
1月前
|
分布式计算 资源调度 Hadoop
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
96 3
|
1月前
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(二)
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(二)
43 3
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
45 2
|
1月前
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
58 2
下一篇
无影云桌面