vSAN数据恢复-开启重删压缩机制的全闪存vSAN数据恢复案例

本文涉及的产品
函数计算FC,每月15万CU 3个月
应用实时监控服务-应用监控,每月50GB免费额度
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: vsan数据恢复环境:一套VMware vSAN超融合基础架构,全闪存,开启压缩重删。共11台服务器节点。每台服务器节点上配置1块PCIE固态硬盘和8-10块SSD固态硬盘。每个服务器节点上创建1个磁盘组,每个磁盘组将1个PCIE固态硬盘识别为2个硬盘作为缓存盘,将8-10个SSD固态硬盘作为容量盘,共同组成vSAN存储空间,用来存储虚拟机文件。vsan故障&检测:vSAN中一台服务器节点的PCIE缓存盘发生故障,导致vSAN逻辑架构出现故障,2台虚拟机磁盘组件出现问题,虚拟机无法正常使用。

vsan数据恢复环境:
一套VMware vSAN超融合基础架构,全闪存,开启压缩重删。共11台服务器节点。每台服务器节点上配置1块PCIE固态硬盘和8-10块SSD固态硬盘。
每个服务器节点上创建1个磁盘组,每个磁盘组将1个PCIE固态硬盘识别为2个硬盘作为缓存盘,将8-10个SSD固态硬盘作为容量盘,共同组成vSAN存储空间,用来存储虚拟机文件。

vsan故障&检测:
vSAN中一台服务器节点的PCIE缓存盘发生故障,导致vSAN逻辑架构出现故障,2台虚拟机磁盘组件出现问题,虚拟机无法正常使用。
将11台节点服务器中的所有磁盘编号后取出,以只读方式做全盘镜像备份,备份完成后将磁盘按照编号还原到原节点服务器中,后续的数据分析和数据恢复操作都基于镜像文件,避免对原始磁盘数据造成二次破坏。
扫描&分析全部镜像文件,发现由于版本更新和开启了压缩重删机制,底层结构差异较大。
针对这种情况的数据恢复,难点在于压缩和重删的算法,因为需要大量数据碰撞测试和大量代码来测试压缩和重删算法。

vsan数据恢复过程:
1、基于镜像文件分析底层数据。根据底层记录的磁盘ID等信息,将节点、磁盘组、缓存盘、容量盘等信息及对应关系进行整理记录。
2、尝试在底层搜索&分析组件信息,结果发现组件信息被压缩,无法进行分析。
3、测试压缩和重删。因该vSAN集群开启了压缩重删机制,底层数据结构发生很大的变化。北亚企安数据恢复工程师搭建相同版本的环境,在搭建好的环境中通过大量数据碰撞测试来研究压缩重删的算法和存储结构。
4、通过大量数据碰撞测试研究压缩重删算法,因为不确定该vSAN集群的采用了何种压缩算法,所以北亚企安数据恢复工程师只能通过大量规律数据进行逆向推理确定其压缩算法,然后解压缩。
压缩块:
01副本.jpg

解压后:
02副本.jpg

5、解析重删位图。通过大量数据测试确定压缩位图位置、记录方式、位图索引块大小等,从而获取位图索引方式,解析重删位图。
03副本.jpg

6、因为VSAN中所有文件都是以对象的方式存在,每个对象会被分割为多个组件。北亚企安数据恢复工程师编写程序扫描组件信息,根据组件中的runlist找到每个数据块和该块在组件的逻辑位置,然后编写程序提取完整组件。
04副本.jpg
05副本.jpg

7、根据组件信息中的描述信息将组件按照描述信息中记录的RAID级别和各个组件在对象中的逻辑位置进行组合,拼接出完整的对象,即完整的vmdk文件。因为每个组件可能会有部分数据留在缓存盘上,并没有写入到容量盘中,所以北亚企安数据恢复工程师编写程序将缓存盘上的数据刷新到对应的组件或对象中。
06副本.jpg
07副本.jpg

8、因为本案例中虚拟磁盘使用Windows下DFS分布式文件系统并且开启重删机制,无法直接提取数据。新建DFS环境,将合并完成的虚拟磁盘挂载到该环境下,挂载后可直接访问数据。
08副本.jpg
09副本.jpg

9、由用户方对数据进行检测,经过检测确认恢复出来的数据完整可用。本次数据恢复工作完成。

相关文章
|
2月前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
7月前
|
存储 SQL 关系型数据库
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
某单位同友存储,存储设备中若干磁盘组建了raid5磁盘阵列。未知原因导致存储设备崩溃无法启动,raid5阵列上层的虚拟机全部丢失,其中存放了重要数据的3台虚拟机需要恢复。
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
|
7月前
|
存储 缓存 固态存储
【vsan数据恢复】vsan分布式存储架构数据恢复案例
VSAN数据恢复环境: 一套有三台服务器节点的VSAN超融合基础架构,每台服务器节点上配置2块SSD硬盘和4块机械硬盘。 每个服务器节点上配置有两个磁盘组,每个磁盘组使用1个SSD硬盘作为缓存盘,2个机械硬盘作为容量盘。三台服务器节点上共配置6个磁盘组,共同组成VSAN存储空间,存放虚拟机文件。 需要恢复服务器节点上的数据库数据。 VSAN故障: 非正常关机导致VSAN逻辑架构出现故障,部分虚拟机磁盘组件出现问题,磁盘文件丢失。
|
2月前
|
存储
服务器数据恢复—EMC存储RAID5阵列崩溃的数据恢复案例
服务器数据恢复环境: 一台EMC某型号存储设备,该存储中有一组由12块(包括2块热备盘)STAT硬盘组建的raid5阵列。 服务器故障: 该存储在运行过程中突然崩溃,raid瘫痪。数据恢复工程师到达现场对故障存储设备进行初检,发现raid中有两块硬盘掉线但只有一块热备盘成功激活,所以导致阵列瘫痪,上层lun无法使用。
|
7月前
|
存储 运维
服务器数据恢复—EqualLogic存储硬盘出现故障的数据恢复案例
服务器数据恢复环境: 一台某品牌EqualLogic PS 6011型号存储,底层有一组由16块SAS硬盘组建的RAID5阵列,上层存储空间划分了4个卷,格式化为VMFS文件系统,存放虚拟机文件。 服务器故障: 存储设备上两块硬盘指示灯显示黄色,磁盘出现故障导致存储不可用,存储已经过保,用户方联系北亚企安数据恢复中心要求恢复数据。
服务器数据恢复—EqualLogic存储硬盘出现故障的数据恢复案例
|
4月前
|
存储 Oracle 关系型数据库
服务器数据恢复—raid5阵列硬盘离线导致上层LUN不可用的恢复数据案例
一台服务器上有8块SAS硬盘,其中的7块硬盘组建了一组RAID5阵列,另外1块硬盘作为热备盘使用。划分了6个LUN,服务器上部署有oracle数据库。 RAID5磁盘阵列中有2块硬盘出现故障并离线,RAID5阵列瘫痪,上层LUN无法正常使用。经过硬件工程师检测,所有硬盘(包括离线的2块盘)均无物理故障以及坏道。
 服务器数据恢复—raid5阵列硬盘离线导致上层LUN不可用的恢复数据案例
|
4月前
|
存储 运维 数据挖掘
服务器数据恢复—raid5阵列2块硬盘离线,热备盘未全部启用的数据恢复案例
服务器存储数据恢复环境: 一台EMC某型号存储中有一组RAID5磁盘阵列。该raid5阵列中有12块硬盘,其中2块硬盘为热备盘。 服务器存储故障: 该存储raid5阵列中有两块硬盘离线,只有1块热备盘启用替换掉其中一块离线盘,另外1块热备盘未成功启用,raid5阵列崩溃,存储不可用。 磁盘阵列中硬盘离线的原因通常是磁盘存在物理故障或者硬盘出现坏道。由于EMC存储中的raid控制器的磁盘检查策略十分严格,经常将硬盘的性能不稳定判定为硬件故障并将该硬盘踢出raid。很多情况下EMC存储中raid崩溃的原因就是磁盘读写不稳定。
服务器数据恢复—raid5阵列2块硬盘离线,热备盘未全部启用的数据恢复案例
|
5月前
|
存储 数据挖掘
服务器数据恢复—EMC存储崩溃后如何恢复存储中raid5阵列数据?
服务器存储数据恢复环境: 一台EMC存储中有一组raid5磁盘阵列,划分1个lun供小型机使用,上层采用ZFS文件系统。 服务器存储故障: 一台有一组raid5磁盘阵列的存储在运行过程中突然崩溃。管理员检查发现存储中的raid5阵列有两块硬盘离线,该阵列中的两块热备盘只有一块热备盘激活成功,raid5阵列瘫痪,存储不可用。
|
6月前
|
Oracle 关系型数据库 数据挖掘
服务器数据恢复—raid5阵列两块盘离线导致服务器数据丢失的数据恢复案例
服务器数据恢复环境: 某品牌x3850 X5服务器,服务器上有一组由5块硬盘组建的raid5阵列(包含一块热备盘),安装linux操作系统,运行oracle数据库。 服务器故障: 服务器上raid5阵列中两块硬盘由于未知故障离线,服务器数据丢失。北亚企安数据恢复中心安排服务器数据恢复工程师达到现场对故障服务器进行初检,发现raid5阵列中有两块硬盘处于离线状态;热备盘未激活,经过检测没有发现物理故障,无明显同步表现。
服务器数据恢复—raid5阵列两块盘离线导致服务器数据丢失的数据恢复案例
|
7月前
|
运维 数据挖掘
服务器数据恢复—RAID5磁盘阵列2块盘离线的数据恢复案例
服务器中有一组由多块硬盘组建的raid5磁盘阵列,服务器阵列中2块硬盘先后掉线导致服务器崩溃。
服务器数据恢复—RAID5磁盘阵列2块盘离线的数据恢复案例