【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN ESXi超融合HCI分布式存储数据恢复案例

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
云备份 Cloud Backup,100GB 3个月
简介: 近期,我司处理了一个由10台华为OceanStor存储组成的vSAN超融合架构,其中一台存储闪存盘出现故障,用户取下后用新的闪存盘代替,然后对该闪存盘所在的磁盘组进行重建,导致集群中一台使用0置备策略的虚拟机数据丢失。

一:案例描述

近期,我司处理了一个由10台华为OceanStor存储组成的vSAN超融合架构,其中一台存储闪存盘出现故障,用户取下后用新的闪存盘代替,然后对该闪存盘所在的磁盘组进行重建,导致集群中一台使用0置备策略的虚拟机数据丢失。

vSAN.png

二:解决方案

1.案例评估

经过现场勘验,得知10台存储都采用相同的配置,2块300GB的ESXi系统盘(RAID1),8块2TB的HDD物理硬盘,4块480GB的SSD闪存盘,重建磁盘组后丢失一个ID为***的虚拟磁盘文件,该虚拟磁盘大小为20TB。ESXi系统盘是独立的,与HDD物理盘和SSD闪存盘是隔绝的,不参与数据存储工作,采用的是常见的VMFS分区结构;其中2块HHD加上1块SSD组成一个磁盘组,本次案例用户在创建集群的时候,选择的是单点式存储,启用了vSAN,三块硬盘都采用了vSAN分区结构;故:同一磁盘组下的2块HDD隶属磁盘组内的SSD,但并没有直接数据关系。

整个VMware vSphere共控制多个集群,其中出现故障的集群使用的vSAN分布式结构存储,该vSAN由10台华为2288H V5 存储构成,每一台存储由2块HDD(物理盘)和一块SSD(闪存盘)构成1个磁盘组,每台存储都有4个磁盘组。

vSAN1.png

2.恢复方案

为确保数据的安全性,需要将10台存储的所有硬盘单独取出,并逐一进行完整的扇区镜像,再对镜像盘进行恢复操作;逐一镜像完成后,使用我司自主研发的VMware vSAN数据恢复系统对镜像文件进行扫描,提取每一块硬盘上面分布式存放的数据单元;使用前依据虚拟对象ID,查找该ID的数据分布情况,查找隶属于该ID的故障域和子故障域将获取的信息写入程序根目录的data.ini配置文件中(如果有数据则清空再写入)。设置组件保存路径,然后分次逐一选择已镜像的磁盘文件,也可以直接选择所有镜像文件所在的目录,VMware vSAN数据恢复系统会自动扫描分散的数据单元,并重构虚拟磁盘文件。数据提取完成后,最终使用任意软件对重构后的文件进行展开,加载后即可访问虚拟磁盘内的文件数据。

vsan3.jpg vsan4.jpg

三:案例总结

随着数据存储量越来越大,一般的存储难以满足很多大公司的使用需求,故数据中心服务器出现了各种虚拟化平台,这些平台为了更好的幸好和方便管理,都自研了一些独有的存储方式,其中最常见的就是分布式存储是基于VMware vSphere ESXi虚拟机所创建的vSAN分布式存储架构。vSAN对象可以看成一个卷,也可以理解成是一个逻辑卷,每个存在于数据存储上的vSAN对象都是由多个组件构成,这些组件分布于集群主机上的磁盘组中。在恢复vSAN数据的过程中,获取组件信息是最关键的,因为组件是每个对象的重要组成部分。

相关文章
|
16天前
|
运维 数据挖掘 开发工具
服务器数据恢复—硬盘离线导致raid5阵列热备盘上线失败的数据恢复案例
服务器磁盘阵列数据恢复环境: 服务器中有两组分别由4块SAS硬盘组建的raid5磁盘阵列,两组raid5阵列划分LUN,组成LVM结构,格式化为EXT3文件系统。 服务器磁盘阵列故障: 服务器中一组raid5阵列中有一块硬盘离线,热备盘自动上线替换离线硬盘。热备盘上线同步数据过程中又有一块硬盘离线,热备盘同步失败,该组raid5阵列崩溃,LVM结构变得不完整,文件系统无法使用。 硬件工程师对两块离线硬盘进行硬件故障检测,发现先离线硬盘无法识别,初步判断该硬盘存在硬件故障,需要进行开盘修复。后离线硬盘可以正常识别。
服务器数据恢复—硬盘离线导致raid5阵列热备盘上线失败的数据恢复案例
|
6天前
|
存储 数据挖掘 数据库
服务器数据恢复—raid磁盘故障导致数据库数据损坏的数据恢复案例
存储中有一组由3块SAS硬盘组建的raid。上层win server操作系统层面划分了3个分区,数据库存放在D分区,备份存放在E分区。 RAID中一块硬盘的指示灯亮红色,D分区无法识别;E分区可识别,但是拷贝文件报错。管理员重启服务器,导致离线的硬盘上线开始同步数据,同步还没有完成就直接强制关机了,之后就没有动过服务器。
|
25天前
|
SQL 数据挖掘 数据库
服务器数据恢复—意外断电导致XenServer虚拟机不可用的数据恢复案例
服务器数据恢复环境: 一台服务器中有一组由4块STAT硬盘通过RAID卡组建的RAID10阵列,上层是XenServer虚拟化平台,虚拟机安装Windows Server操作系统,作为Web服务器使用。 服务器故障: 因机房异常断电导致服务器中一台VPS(Xen Server虚拟机)不可用,虚拟磁盘文件丢失。
服务器数据恢复—意外断电导致XenServer虚拟机不可用的数据恢复案例
|
11天前
|
JavaScript 前端开发
vue配合axios连接express搭建的node服务器接口_简单案例
文章介绍了如何使用Express框架搭建一个简单的Node服务器,并使用Vue结合Axios进行前端开发和接口调用,同时讨论了开发过程中遇到的跨域问题及其解决方案。
12 0
vue配合axios连接express搭建的node服务器接口_简单案例
|
22天前
|
存储 SQL 数据挖掘
虚拟化数据恢复—VMware虚拟机vmdk文件被误删除的数据恢复案例
虚拟化数据恢复环境: 某品牌服务器(部署VMware EXSI虚拟机)+同品牌存储(存放虚拟机文件)。 虚拟化故障: 意外断电导致服务器上某台虚拟机无法正常启动。查看虚拟机配置文件发现这台故障虚拟机除了磁盘文件以外其他配置文件全部丢失,xxx-flat.vmdk磁盘文件和xxx-000001-delta.vmdk快照文件还在。管理员联系VMware工程师寻求帮助。VMware工程师尝试新建一个虚拟机来解决故障,但发现ESXi存储空间不足。于是将故障虚拟机下的xxx-flat.vmdk磁盘文件删除,然后重建一个虚拟机并且分配固定大小的虚拟磁盘。
|
23天前
|
存储 数据挖掘 Linux
服务器数据恢复—Linux操作系统网站服务器数据恢复案例
服务器数据恢复环境: 一台linux操作系统服务器上跑了几十个网站,服务器上只有一块SATA硬盘。 服务器故障: 服务器突然宕机,尝试再次启动失败。将硬盘拆下检测,发现存在坏扇区
|
8天前
|
存储 Oracle 关系型数据库
服务器数据恢复—存储硬盘故障导致映射到服务器上的卷挂载不上的数据恢复案例
一台存储上有一组由16块FC硬盘组建了一组raid。存储前面板上的对应10号和13号硬盘的故障灯亮起,存储映射到redhat linux操作系统服务器上的卷挂载不上,业务中断。
|
9天前
|
存储 Unix 数据挖掘
服务器数据恢复—SAN环境下LUN Mapping出错导致文件系统共享冲突的数据恢复案例
服务器数据恢复环境: SAN环境下一台存储设备中有一组由6块硬盘组建的RAID6磁盘阵列,划分若干LUN,MAP到不同业务的SOLARIS操作系统服务器上。 服务器故障: 用户新增了一台服务器,将存储中的某个LUN映射到新增加的这台服务器上。这个映射的LUN其实之前已经MAP到其他SOLARIS操作系统的服务器上了。由于没有及时发现问题,新增加的这台服务器已经对此LUN做了初始化操作,磁盘报错,重启后发现卷无法挂载。
|
4月前
|
Unix Linux 虚拟化
虚拟机VMware知识积累
虚拟机VMware知识积累
|
2月前
|
测试技术 Linux 虚拟化
iOS自动化测试方案(五):保姆级VMware虚拟机安装MacOS
详细的VMware虚拟机安装macOS Big Sur的保姆级教程,包括下载VMware和macOS镜像、图解安装步骤和遇到问题时的解决方案,旨在帮助读者顺利搭建macOS虚拟机环境。
60 3
iOS自动化测试方案(五):保姆级VMware虚拟机安装MacOS

热门文章

最新文章

下一篇
无影云桌面