北亚企安数据恢复-VSAN数据恢复方案

本文涉及的产品
无影云电脑个人版,1个月黄金款+200核时
无影云电脑企业版,4核8GB 120小时 1个月
资源编排,不限时长
简介: 存储介质清单 :一共8台服务器节点,每节点2个磁盘组,其中1个磁盘组配置1块SSD固态硬盘,4块1.2T机械硬盘;另一个磁盘组配置1块SSD固态硬盘,4块2T机械硬盘。共计16块SSD固态硬盘和64块机械硬盘。故障描述:一个节点服务器掉线,导致部分虚拟机无法访问。期望恢复数据:恢复VSAN环境中故障虚拟磁盘数据。

一、用户信息:
广东某单位

二、数据恢复环境:
主机操作系统:ESXI
分区类型:VSAN
存储介质清单 :一共8台服务器节点,每节点2个磁盘组,其中1个磁盘组配置1块SSD固态硬盘,4块1.2T机械硬盘;另一个磁盘组配置1块SSD固态硬盘,4块2T机械硬盘。共计16块SSD固态硬盘和64块机械硬盘。
故障描述:一个节点服务器掉线,导致部分虚拟机无法访问。
期望恢复数据:恢复VSAN环境中故障虚拟磁盘数据。

三、数据恢复项目成员&分工:
项目主管 宋国建 负责每一步流程审核,项目协调,方案制定。
商务工程师 王宇晴 负责反馈消息给用户。
实施工程师 吴庆亮 负责技术实现。

四、初检&恢复概率:
8台服务器节点,64块数据盘,16个SSD固态硬盘。在使用过程中,由于一个节点服务器故障离线,导致部分虚拟机数据无法访问。
VSAN架构比较复杂,元信息和数据结构解析比较困难。节点服务器故障导致部分虚拟机无法访问,这种情况下可能存在元信息丢失或者损坏的情况,需要拿到硬盘后具体分析。根据北亚企安做过大量VSAN数据恢复案例的经验,这种故障情况下数据恢复的可行性较大,完整恢复数据的可能性在98%以上。

五、数据恢复流程:
商务流程:
1、签订数据恢复协议、保密协议。
2、实施数据安全救援工作(见下方的技术流程)。
3、进行数据验收。
A、验收成功:客户签字确认;在约定周期内,完成付款及开具发票流程。提供后续数据保管、服务跟踪及技术咨询服务。
B、验收不成功,销毁中转数据及已恢复数据,移交设备。
技术流程:
1、备份:
A、将所有节点服务器断电、关机,并取出所有数据硬盘和固态硬盘。
B、准备一台恢复操作服务器(北亚企安提供)、一台备份存储(可北亚企安提供,也可因数据敏感等原因由用户提供),在恢复平台上以只读方式挂载服务器硬盘,使用北亚企安磁盘备份工具(或 dd等工具)进行完整的扇区对扇区的备份。
C、备份完成后,提供详细报告,涉及硬盘健康状态及可能存在的坏道列表。
D、将服务器硬盘交回给用户,之后不再直接操作原介质。
2、故障硬盘修复:
检测故障硬盘损坏情况,对可能存在故障的硬盘进行修复,并完整读取故障硬盘中的数据。
3、磁盘组结构分析:
A、对每个服务器节点上的SSD硬盘和机械硬盘进行分析;
B、分析磁盘组中,磁盘之间的聚合方式;
C、分析每个磁盘组中数据的分布情况;
D、分析磁盘组之间的聚合结构。
4、虚拟机位图分析:
A、定位磁盘组中虚拟机的位图信息;
B、提取并解析磁盘组中虚拟机的位图;
C、确定丢失虚拟磁盘的位图信息。
5、虚拟磁盘拼接:
A、根据虚拟磁盘的位图信息提取文件片段;
B、对虚拟磁盘文件的片段进行拼接;
C、校验拼接后的磁盘文件的正确性。
6、快照合并:
A、使用恢复出的父盘文件进行快照合并;
B、校验合并后的磁盘文件的正确性;
C、磁盘文件结构修复。
7、解析并修复文件系统:
A、校验提取出的虚拟磁盘中文件系统的完整性及正确性;
B、对数据虚拟磁盘中的文件系统进行修复。
8、 解析文件系统及数据恢复:
A、使用专业的数据恢复软件对虚拟磁盘中的文件系统进行解析及删除数据恢复;
B、恢复虚拟磁盘中的所有被删除的数据。
9、数据验证:
A、由用户主导对数据本身进行详细验证;
B、如发现新问题,重新检验上述所有恢复过程。

六、服务承诺:
1、整个数据恢复过程不会对原盘有任何的写操作,以确保原盘的数据安全。
2、尽可能保证每一步操作可逆,确保人力可控范围内操作可回溯。
3、以上所有操作都是在有备份的情况下进行,若不成功不影响其他数据恢复方案的继续。

七、数据恢复时间预估:
原始磁盘镜像:约100G/每小时(可同步进行)
磁盘组结构分析:2天
数据位图分析:2天
磁盘文件拼接:2天
数据移交:1天
总时间:7-10个工作日,上述时间只是预估,以实际情况为准。

相关文章
|
存储 Unix 数据挖掘
Netapp数据恢复—Netapp存储误删除lun的数据恢复案例
Netapp存储数据恢复环境: 北京某公司一台netAPP存储,72块SAS硬盘划分了若干个lun。 Netapp存储故障: 工作人员误操作删除了12个lun。
Netapp数据恢复—Netapp存储误删除lun的数据恢复案例
|
6月前
|
存储 运维
服务器数据恢复—EqualLogic存储硬盘出现故障的数据恢复案例
服务器数据恢复环境: 一台某品牌EqualLogic PS 6011型号存储,底层有一组由16块SAS硬盘组建的RAID5阵列,上层存储空间划分了4个卷,格式化为VMFS文件系统,存放虚拟机文件。 服务器故障: 存储设备上两块硬盘指示灯显示黄色,磁盘出现故障导致存储不可用,存储已经过保,用户方联系北亚企安数据恢复中心要求恢复数据。
服务器数据恢复—EqualLogic存储硬盘出现故障的数据恢复案例
|
3月前
|
存储 运维 Windows
服务器数据恢复—V7000存储磁盘阵列柜进水导致故障的数据恢复案例
一台v7000存储机头+7个磁盘阵列柜,阵列柜上共有80块SAS机械硬盘,这些磁盘组建了8组Mdisk,加到一个pool中,一共分配了13个lun。服务器安装Windows server操作系统,格式化为NTFS文件系统,存放的数据主要是影像图片资料。
服务器数据恢复—V7000存储磁盘阵列柜进水导致故障的数据恢复案例
|
4月前
|
存储 数据挖掘 Linux
服务器数据恢复—机房搬迁导致服务器无法识别raid的数据恢复案例
某单位机房搬迁,将所有服务器和存储搬迁到新机房并重新连接线路,启动所有机器发现其中有一台服务器无法识别RAID,提示未做初始化操作。 发生故障的这台服务器安装LINUX操作系统,配置了NFS+FTP作为单位内部的文件服务器使用。服务器为ProLiant DL380系列服务器,通过hp smart array控制器挂载了一组由14块SCSI硬盘组成的RAID5磁盘阵列。该raid5磁盘阵列采用双循环的校验方式。 北亚企安数据恢复工程师到达现场后对故障服务器进行了初检,经过检测发现raid信息丢失。
服务器数据恢复—机房搬迁导致服务器无法识别raid的数据恢复案例
|
4月前
|
存储 负载均衡 算法
服务器数据恢复—EVA存储介绍&常见故障和数据恢复
EVA存储常见故障: 1、RSS中多个磁盘掉线,超过冗余保护级别。 2、加入新磁盘,进行数据迁移时,新磁盘存在物理故障。 3、VDISK被删除或EVA初始化。 4、突发性主机与存储无法连接。无法discover存储。
服务器数据恢复—EVA存储介绍&常见故障和数据恢复
|
3月前
|
存储 安全 数据安全/隐私保护
服务器数据恢复—服务器raid常见故障的数据恢复方案
磁盘阵列(raid)是一种将多块物理硬盘整合成一个虚拟存储的技术。raid模块相当于一个存储管理中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写。相对于单独的物理硬盘,raid可以为用户提供更大的独立存储空间,更快的读写速度,更高的数据存储安全及更方便的统一管理模式。磁盘阵列的正常运行是保障服务器中数据正常读写的关键。
服务器数据恢复—服务器raid常见故障的数据恢复方案
|
4月前
|
存储 SQL 运维
服务器数据恢复—Isilon存储误删除vmware虚拟机的数据恢复案例
Isilon存储使用的是分布式文件系统OneFS。在Isilon存储集群里面每个节点均为单一的OneFS文件系统,所以Isilon存储在进行横向扩展的同时不会影响数据的正常使用。Isilon存储集群所有节点提供相同的功能,节点与节点之间没有主备之分。当用户向Isilon存储集群中存储文件时,OneFS文件系统层面将文件划分为128K的片段分别存放到不同的节点中,而节点层面将128K的片段分成8K的小片段分别存放到节点的不同硬盘中。用户文件的Indoe信息、目录项及数据MAP则会分别存储在所有节点中,这样可以确保用户不管从哪个节点都可以访问到所有数据。Isilon存储在初始化时会让用户选择相应的
69 12
|
5月前
|
存储 算法 小程序
服务器数据恢复—OceanStor 5800存储磁盘阵列数据恢复案例
服务器存储数据恢复环境: 华为OceanStor 5800存储,该存储中有一组由10块硬盘组建的raid6磁盘阵列,供企业内部使用,服务器安装linux操作系统+EXT3文件系统,划分2个lun。 服务器存储故障: 管理员发现存储中raid6磁盘阵列不可用,于是将原raid6阵列中的磁盘作为成员盘重新分配raid,并对raid进行初始化。初始化进行到40%左右时,管理员意识到问题,于是强行终止初始化,部分数据已经被破坏,而且不可逆。 导致服务器存储中数据丢失的原因是raid失效,管理员将raid6阵列中的9块硬盘作为成员盘来重新分配riad5阵列,并进行了长时间的初始化操作,这个过程对原始数
|
5月前
|
存储 数据挖掘
服务器数据恢复—EMC存储raid5磁盘阵列崩溃的数据恢复案例
一台EMC某型号存储由于存储中raid5阵列出现故障导致服务器崩溃,由于数据涉密,需要工程师到现场恢复数据。 服务器数据恢复工程师到现场后对数据进行检测,经过检测发现服务器崩溃是由于raid中某些硬盘掉线所导致。将所有磁盘编号后取出,硬件工程师对所有磁盘进行检测后没有发现有硬盘存在物理故障,也没有坏道。数据恢复工程师将所有磁盘以只读方式做扇区级的全盘镜像,镜像完成后将所有磁盘还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
服务器数据恢复—EMC存储raid5磁盘阵列崩溃的数据恢复案例
|
6月前
|
存储 运维 Oracle
Netapp数据恢复—Netapp存储中lun被误删除的数据恢复案例
NetApp存储数据恢复环境: NetApp FAS某型号存储,该NetApp存储中有96块扇区大小是520字节的SAS硬盘。存储中的lun都映射给小型机使用,存放Oracle数据库文件,采用ASM裸设备存储方式。 NetApp存储故障: 工作人员误操作删除了该NetApp存储上所有lun。 和工作人员沟通后得知:由于业务需要,需要重新规划该NetApp存储的存储空间,工作人员直接把存储卷全部删除并重新分配。在完成卷的删除但还没有重新分配的时候,上层业务宕机。运维工程师紧急排查故障情况,发现跑业务的服务器上的磁盘都“消失”了,无法访问数据。
 Netapp数据恢复—Netapp存储中lun被误删除的数据恢复案例