分布式系统详解--框架(Hadoop-HDFS的HA搭建及测试)

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
云原生网关 MSE Higress,422元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: 分布式系统详解--框架(Hadoop-HDFS的HA搭建及测试)

分布式系统详解 - 框架(Hadoop的HDFS的HA搭建及测试)

一,背景概述

解决问题1:通过上面的图我们可以明确的看出来,如果的的Namenode坏掉了,那我们的整个集群可以说就是要瘫痪了也就是单节点故障问题。

于是现在就出现了另外一张图,我截取的〜在这儿我们看到有两个名称节点,一个是(Acticve),另外一个是待机。

该图特点:

1,他们被上面ZKFS - ZK转移控制器操控。

2,他们质检也可以进行共享元数据。

3,他们被Zookeeper Cluster进行监控协调。

在这里没有secondaryNamenode,却分为了两处。也就是说,一个是正在活跃使用的,另外一个就是随时待命的。

Hdfs ha几大重点:

(1)保证两个名称节点里面的内存中的存储文件元数据同步,名称节点启动时会读镜像文件。

(2)变化的记录信息同步。

(3)日志文件的安全性。分布式的存储日志文件(2N + 1)基数个。使用动物园管理员进行监控.zookeeper对时间同步要求比较高。

(4)客户端如何知道访问哪一个namenode.1,使用代理代理0.2,隔离机制0.3,使用sshfence.4,两个namenome之间无密码登录。

(5)名称节点是哪一个ACTIVE.1,动物园管理员通过选举选出动物园管理员。通过监控,自动排除。

      Hadoop2.x官方提供两种HDFS HA解决方案,一种是NFS,另外一种是QJM(由cloudra提出,原理类似于zookeeper)。在这篇文章当中我们使用QJM来完成,主备namenode之间通过一组Journalnode同步元数据信息。一条数据只要成功写入Journalnode就被认为是写入成功。通常配置基数个Journalnode。

二,配置规划

IP 主机名                                   节点
192.168.71.234 centos01 namenode,datanode,journalnode,qurnompeerMain,ZKF
192.168.71.235 centos02 namenode,datanode,journalnode,qurnompeerMain,ZKF
192.168.71.233 MyLinux datanode,journalnode,qurnompeerMain

 

 

 

 

 

设置免登陆

centos01 - > MyLinux,centos01,centos02

centos02 - > MyLinux,centos01,centos02

centos01 < - > centos02

三,HDFS的HA配置

3.1将普通集群进行备份

mv /opt/hadoop-2.7.5 /opt/hadoop-2.7.5_bak

3.2重新解压hadoop,这次我们将目录放在/ user / local下面

tar -zxvf /opt/hadoop-2.7.5.tar.gz -C /usr/local/

3.3修改解压后的目录中vi ./etc/hadoop/hadoop-env.sh修改器jdk目录 - 第一个文件

3.4修改解压后的目录中vi ./etc/hadoop/core-site.xml

<configuration>
<!--指定hdfs的命名空间 -->
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://qf</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hahadoopdata/tmp</value>
</property>
<!--配置操作hdfs的缓冲大小-->
<property>
<name>io.file.buffer.size</name>
<value>4096</value>
</property>
</configuration>

3.5修改解压后的目录中vi ./etc/hadoop/hdfs-site.xml

<configuration>
<!--块大小-->
<property>
  <name>dfs.block.size</name>
  <value>134217728</value>
</property>
<!--hdfs存储的元数据位置-->
<property>
  <name>dfs.namenode.name.dir</name>
  <value>/home/hahadoopdata/dfs/name</value>
</property>
<!--hdfs的数据存放位置-->
<property>
  <name>dfs.datanode.data.dir</name>
  <value>/home/hahadoopdata/dfs/data</value>
</property>
<!--指定hdfs的虚拟服务名-->
<property>
  <name>dfs.nameservices</name>
  <value>qf</value>
</property>
<!--指定hdfs的虚拟服务名下的namenode的名字-->
<property>
  <name>dfs.ha.namenodes.qf</name>
  <value>nn1,nn2</value>
</property>
<!--指定namenode的内部通讯地址-->
<property>
  <name>dfs.namenode.rpc-address.qf.nn1</name>
  <value>centos01:9000</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.qf.nn2</name>
  <value>centos02:9000</value>
</property>
<!--指定namenode的web ui通讯地址-->
<property>
  <name>dfs.namenode.http-address.qf.nn1</name>
  <value>centos01:50070</value>
</property>
<property>
  <name>dfs.namenode.http-address.qf.nn2</name>
  <value>centos02:50070</value>
</property>
<!--指定journalnode数据共享目录-->
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://centos01:8485;centos02:8485;MyLinux:8485/qf</value>
</property>
<!--指定namenode的失败进行自动切换的主类-->
<property>
  <name>dfs.client.failover.proxy.provider.qf</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
 
<!--是否开启namenode的失败进行自动切换的主类-->
<property>
  <name>dfs.ha.automatic-failover.enabled</name>
  <value>true</value>
</property>
<!--指定两个active状态都存在时,杀死其中一个-->
<property>
  <name>dfs.ha.fencing.methods</name>
  <value>sshfence</value>
</property>
<property>
  <name>dfs.ha.fencing.ssh.private-key-files</name>
  <value>/root/.ssh/id_rsa</value>
</property>
 
<property>
  <name>dfs.ha.fencing.ssh.connect-timeout</name>
  <value>30000</value>
</property>
<!--指定journalnode本地的数据共享目录-->
<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/home/hahadoopdata/journal/data</value>
</property>
<!--指定zk的集群地址,用来协调namenode服务-->
<property>
  <name>ha.zookeeper.quorum</name>
  <value>centos01:2181,centos02:2181,MyLinux:2181</value>
</property>
 
</configuration>

3.6修改解压后的目录中vi ./etc/hadoop/slaves

centos01
centos02
MyLinux

3.7配置免登陆

(1)ssh-keygen -t rsa一路回车

(2)ssh-copy-id centos01

        ssh-copy-id centos02

        ssh-copy-id MyLinux

3.8远程发送配置好的Hadoop的到其他两台机器上去。

scp -r ../hadoop-2.7.5/ centos02:/usr/local/

scp -r ../hadoop-2.7.5/ MyLinux:/usr/local/

四,启动(预先关闭防火墙,或将所有用到的端口允许开启)

(1)启动三台 zkServer.sh start --也就是zookeeper

(2)启动 journalnode 利用 多个进程

(3)启动 namenode

(4)启动start-dfs.sh  

4.1启动ZK三台

zkServer.sh start启动

4.2进程启动

单个进程:./sbin/hadoop-daemon.sh start journalnode

多个进程:./sbin/hadoop-daemons.sh start journalnode

4.3选择任意一台名称节点来进行格式化(centos02)

(1)hdfs namenode -format

(2)启动名称节点。

./sbin/hadoop-daemon.sh start namenode

4.4在另外一台名称节点的机子上拉去元数据(也可以使用复制)

hdfs namenode -bootstrapStandby

或者,scp -r/home/hahadoopdata/dfs -C centos01:/home/hahadoopdata/

4.5格式化zkfc

hdfs zkfc -formatZK

4.6登录zk zkCli.sh查看节点。

4.7启动。./sbin/start-dfs.sh  

五,测试

5.1查看对应进程是否均已经启动。成功

5.2查看web ui是否正常启动成功  

5.3在HDFS读写中文件  成功

上传将本地的文件上传到hdfs文件系统中.hdfs dfs -put /home/test/a.txt /

5.4一个名称节点运行停止查看另一个能否自动启动  成功

(1)关闭centos01即处于活性的进程

(2)查看centos02的web ui            

(3)重新启动centos01 ./sbin/hadoop-daemon.sh start namenode

我们发现此时的centos01已经成为待待状态

很棒很棒~~完美完美~~

目录
打赏
0
0
0
0
11
分享
相关文章
Playwright 自动化测试系列(6)| 第三阶段:测试框架集成​指南:参数化测试 + 多浏览器并行执行
Pytest 与 Playwright 集成可提升自动化测试效率,支持参数化测试、多浏览器并行执行及统一报告生成。通过数据驱动、Fixture 管理和并行优化,显著增强测试覆盖率与执行速度,适用于复杂 Web 应用测试场景。
Metasploit Pro 4.22.7-2025061201 (Linux, Windows) - 专业渗透测试框架
Metasploit Pro 4.22.7-2025061201 (Linux, Windows) - 专业渗透测试框架
95 3
Metasploit Pro 4.22.7-2025061201 (Linux, Windows) - 专业渗透测试框架
|
23天前
|
Metasploit Pro 4.22.8-2025073001 (Linux, Windows) - 专业渗透测试框架
Metasploit Pro 4.22.8-2025073001 (Linux, Windows) - 专业渗透测试框架
59 0
Playwright 自动化测试系列(7)| 第三阶段:测试框架集成​​Page Object 模式
本课程详解Playwright测试框架中的Page Object模式,通过电商登录-下单实战演示PO架构设计与高级技巧,结合Pytest实现多用户测试。重点解析PO模式提升代码复用性、降低维护成本的核心价值,并提供常见问题解决方案,助力构建高可维护性的自动化测试体系。
|
3月前
|
Metasploit Pro 4.22.7-2025052201 (Linux, Windows) - 专业渗透测试框架
Metasploit Pro 4.22.7-2025052201 (Linux, Windows) - 专业渗透测试框架
105 5
Metasploit Pro 4.22.7-2025052201 (Linux, Windows) - 专业渗透测试框架
Metasploit Pro 4.22.7-2025051201 (Linux, Windows) - 专业渗透测试框架
Metasploit Pro 4.22.7-2025051201 (Linux, Windows) - 专业渗透测试框架
82 4
Metasploit Pro 4.22.7-2025051201 (Linux, Windows) - 专业渗透测试框架
自动化测试框架深度解析与选择指南
Apache JMeter是Apache组织基于Java开发的一款压力测试工具,旨在测试软件的性能承受能力。它支持多种协议测试及功能测试,提供灵活的断言创建能力,如同创建带断言的脚本来验证程序是否返回预期结果。
Jmeter工具使用:HTTP接口性能测试实战
希望这篇文章能够帮助你初步理解如何使用JMeter进行HTTP接口性能测试,有兴趣的话,你可以研究更多关于JMeter的内容。记住,只有理解并掌握了这些工具,你才能充分利用它们发挥其应有的价值。+
619 23
接口测试新选择:Postman替代方案全解析
在软件开发中,接口测试工具至关重要。Postman长期占据主导地位,但随着国产工具的崛起,越来越多开发者转向更适合中国市场的替代方案——Apifox。它不仅支持中英文切换、完全免费不限人数,还具备强大的可视化操作、自动生成文档和API调试功能,极大简化了开发流程。
2025接口测试全攻略:高并发、安全防护与六大工具实战指南
本文探讨高并发稳定性验证、安全防护实战及六大工具(Postman、RunnerGo、Apipost、JMeter、SoapUI、Fiddler)选型指南,助力构建未来接口测试体系。接口测试旨在验证数据传输、参数合法性、错误处理能力及性能安全性,其重要性体现在早期发现问题、保障系统稳定和支撑持续集成。常用方法包括功能、性能、安全性及兼容性测试,典型场景涵盖前后端分离开发、第三方服务集成与数据一致性检查。选择合适的工具需综合考虑需求与团队协作等因素。
499 24
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问