VMware虚拟化之VSA(vSphere Storage Appliance)群集(二) 故障恢复详测

简介:

在上一篇文档中,曾详细的介绍了VSA群集的部署及安装全过程,以及安装过程中可能会遇到的一些问题及对应的解决方法,本篇将介绍VSA群集的容灾及故障恢复情况。部署一套环境,不能说是安装完就完事了,肯定要对故障发生时的恢复做一定的测试,才能更好的理解整个平台的实用效果。 
八、故障恢复
在之前的文档中曾有说明,我们的实验采用的是三主机的结构,但不论是双主机还三主机结构,都仅能够对单节点故障进行恢复,这个原因,当了解了VSA的整个群集结构就会很明白了,也正是因此,VSA群集只有双主机和三主机两种部署结构模式。下图为VSA群集三主机结构拓扑图:

其中:标示IP地址的图标为三台ESXi物理主机,VSA-0、VSA-1、VSA-2为三台ESXi主机内构建的用于发布NFS共享磁盘的SUSE Linux虚拟机,VSADs(浅蓝色图标)为每个VSA虚拟机分别创建的两个共享磁盘,而每两个VSA虚拟机采用RAID1的模式实现相互冗余共同提供两个VSADs(灰色图标)镜像模式的共享磁盘,最后共提供三个镜像模式共享磁盘。这样,其中任何一台物理主机或者虚拟机断电或者宕机,也不会影响到共享磁盘的VSADs的正常使用。这样的容灾模式是非常安全的。 www.it165.net
1.单节点断电故障恢复操作
这里我们已经将10.15.20.103这台主机电源拔下,当前此主机处于断电状态时,VSA群集状态便如下图:


  


    注:主机在断电之后,对应的部分共享存储盘处于已降级状态,同时在映射拓扑中状态也会有所改变。
我们给断电的主机重新加电并启动,在正常启动完成后,当VSA群集检测到该主机信号后,会立即对群集存储进行恢复,恢复群集及存储状态所需时间大约为5分钟左右。恢复后即为下图(消除了已降级状态):


  


2.单节点主机瘫痪故障及替换恢复操作
这里模拟了10.15.20.103这台主机瘫痪故障,主机由于硬件故障等原因瘫痪,已经断电且不能在群集中运行,需要在维护该主机后或通过备用物理机来替换该主机时,VSA群集的状态会出现如下图变化:

  

    要说明的是,如果主机故障导致系统崩溃,或者使用新装好ESXi的备用机替换故障主机时,该如何操作呢?参考下面的方法,就能完成替换主机:
这里我们需要先准备好替换的备用ESXi主机,该ESXi主机的版本需要与VSA群集中的其他主机版本相同,在准备好替换的主机后,将新的主机连接进入vCenter,但不要手动将该主机加入VSA群集中,
在vCenter中的VSA Manager控制面板中的“设备”选项卡中,我们可以看到故障主机对应设备状态已经是“脱机”状态,右键单击此“脱机”状态的设备,然后选择“替换设备”,如下图:

选择了“替换设备”后,会弹出设备替换操作会话窗口,按如下图示方法进行操作:
 

   

  

此处,便开始设备替换的安装操作,会为新的ESXi主机自动安装VSA群集。
自动安装VSA群集的时间约为30分钟左右,根据主机的配置以及已占用资源的不同,所需时间可能会有差异,安装好之后,VSA群集状态恢复如下图:


  

注:我们看到VSA群集的数据存储状态依然是已降级状态,这是因为替换上来的主机,还没有完成共享磁盘配置,而此配置,也是由VSA群集自动完成的。
在为新替换的ESXi主机安装完VSA群集后,群集会自动开始恢复共享磁盘的配置,在vCenter的任务栏中,我们会看到如下图的任务正在进行:
 



该恢复操作包含两个此任务,完成此配置的恢复,大约需要7~9小时的时间不等,而根据主机配置以及已使用资源的不同,时间可能会有差异。
配置恢复完成后,VSA群集即恢复为正常状态。
 
注意:在自动安装的VSA群集,是默认不开启vSphere DRS功能的,如果在使用过程中因为需要开启了vSphere DRS功能,则在做故障切换或者替换设备时,需要暂时关闭该功能,否则故障切换可能会因为资源池的原因出现错误。设置开启及关闭vSphere DRS功能时,在vCenter中右键单击“VSA HA cluster”群集,然后选择“编辑设置”后出现设置会话框,详情设置如下图:

 

    至此,VSA群集的故障恢复详测结束。如有疑问欢迎投稿及联系本人。

本文转自学海无涯博客51CTO博客,原文链接http://blog.51cto.com/549687/1830137如需转载请自行联系原作者

520feng2007
相关文章
|
7月前
|
虚拟化 Android开发 云计算
6个VMware桌面虚拟化的替代方案
6个VMware桌面虚拟化的替代方案
540 1
|
2月前
|
存储 网络安全 虚拟化
虚拟化数据恢复—VMware ESX Server数据恢复案例
虚拟化数据恢复环境: 某企业信息管理平台, 几台VMware ESX Server主机共享一台存储设备,大约有几十台虚拟机。 虚拟化故障&原因: Vcenter报告虚拟磁盘丢失。管理员通过ssh远程到ESX中执行fdisk -l命令查看磁盘,发现STORAGE已经没有分区表了。重启所有设备后,ESX SERVER均无法连接到存储设备中的STORAGE。
|
4月前
|
存储 监控 固态存储
【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN 分布式存储虚拟化平台VMDK文件1KB问题数据恢复案例
在一例vSAN分布式存储故障中,因替换故障闪存盘后磁盘组失效,一台采用RAID0策略且未使用置备的虚拟机VMDK文件受损,仅余1KB大小。经分析发现,该VMDK文件与内部虚拟对象关联失效导致。恢复方案包括定位虚拟对象及组件的具体物理位置,解析分配空间,并手动重组RAID0结构以恢复数据。此案例强调了深入理解vSAN分布式存储机制的重要性,以及定制化数据恢复方案的有效性。
111 5
|
1月前
|
存储 SQL 数据库
虚拟化数据恢复—Vmware虚拟机误还原快照的数据恢复案例
虚拟化数据恢复环境: 一台虚拟机从物理机迁移到ESXI虚拟化平台,迁移完成后做了一个快照。虚拟机上运行了一个SQL Server数据库,记录了数年的数据。 ESXI虚拟化平台上有数十台虚拟机,EXSI虚拟化平台连接了一台EVA存储,所有的虚拟机都存放在EVA存储上。 虚拟化故障: 工组人员误操作将数年前迁移完成后做的快照还原了,也就意味着虚拟机状态还原到数年前,近几年数据都被删除了。 还原快照相当于删除数据,意味着部分存储空间会被释放。为了不让这部分释放的空间被重用,需要将连接到这台存储的所有虚拟机都关掉,需要将不能长时间宕机的虚拟机迁移到别的EXSI虚拟化平台上。
111 50
|
1月前
|
存储 网络安全 虚拟化
虚拟化数据恢复—VMware ESX SERVER数据恢复案例
虚拟化数据恢复环境&故障: 某单位信息管理平台,数台VMware ESX SERVER共享一台某品牌DS4100存储。 vc报告虚拟磁盘丢失,管理员ssh到ESX中执行fdisk -l查看磁盘,发现STORAGE中的分区表不见了。重启所有设备后,ESX SERVER均无法连接到DS4100存储中的STORAGE。
|
3月前
|
存储 SQL 数据挖掘
虚拟化数据恢复—VMware虚拟机vmdk文件被误删除的数据恢复案例
虚拟化数据恢复环境: 某品牌服务器(部署VMware EXSI虚拟机)+同品牌存储(存放虚拟机文件)。 虚拟化故障: 意外断电导致服务器上某台虚拟机无法正常启动。查看虚拟机配置文件发现这台故障虚拟机除了磁盘文件以外其他配置文件全部丢失,xxx-flat.vmdk磁盘文件和xxx-000001-delta.vmdk快照文件还在。管理员联系VMware工程师寻求帮助。VMware工程师尝试新建一个虚拟机来解决故障,但发现ESXi存储空间不足。于是将故障虚拟机下的xxx-flat.vmdk磁盘文件删除,然后重建一个虚拟机并且分配固定大小的虚拟磁盘。
|
4月前
|
存储 固态存储 虚拟化
【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN ESXi超融合HCI分布式存储数据恢复案例
近期,我司处理了一个由10台华为OceanStor存储组成的vSAN超融合架构,其中一台存储闪存盘出现故障,用户取下后用新的闪存盘代替,然后对该闪存盘所在的磁盘组进行重建,导致集群中一台使用0置备策略的虚拟机数据丢失。
100 6
|
4月前
|
存储 安全 Linux
在Linux中,如何使用VMware和VirtualBox进行虚拟化?
在Linux中,如何使用VMware和VirtualBox进行虚拟化?
|
6月前
|
存储 IDE 开发工具
【读书笔记】 玩转虚拟机基于Vmware+Windows 虚拟化技术
【读书笔记】 玩转虚拟机基于Vmware+Windows 虚拟化技术
|
6月前
|
Linux 网络安全 虚拟化
Linux操作系统第一章(Linux操作系统的带入,vmware-17虚拟化软件运用,FinalShell远程连接Linux )
Linux操作系统第一章(Linux操作系统的带入,vmware-17虚拟化软件运用,FinalShell远程连接Linux )

相关课程

更多