服务器数据恢复环境:
一台V7000存储,该存储上有一组由12块硬盘组建的raid5磁盘阵列,其中包括一块热备盘。
服务器故障:
管理员在巡检过程中发现该存储中的raid5阵列有一块硬盘掉线,于是使用一块新的硬盘更换掉线硬盘并同步数据。数据同步进行还不到50%的时候,该存储中又有一块硬盘掉线,存储崩溃,逻辑盘无法挂载,两块硬盘脱机。
服务器数据恢复过程:
1、拿到故障存储后,将故障存储中所有硬盘编号后取出,由硬件工程师初步检测这些硬盘是否存在物理故障,经过检测发现掉线的两块磁盘均存在大量坏道,通过专业数据恢复设备对存在坏道的硬盘做镜像。针对其他完好的硬盘,以只读方式进行扇区级的全盘镜像。镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、针对存储中有多块硬盘掉线的故障情况,北亚企安数据恢复工程师团队有两种数据恢复方案:
a、强制上线。物理修复后掉线的硬盘,修复完成后将这块磁盘装到原盘位强制上线。这种方案操作简单,节省时间,但是成功率非常低。
b、如果方案a(强制上线)操作失败可以尝试这种办法。通过分析获取到存储中磁盘阵列的相关信息,利用获取到的raid信息虚拟重组磁盘阵列。
3、通过和管理员沟通,北亚企安数据恢复工程师了解到硬盘掉线的先后顺序,将后掉线的硬盘交给硬件工程师进行物理修复&镜像硬盘数据,然后尝试进行强制上线操作。由于根据强制上线成功率不高,所以只是尝试一下看能否成功恢复数据,没想到强制上线居然成功,所有数据都恢复出来了。经过用户检测确认数据完整有效。
Tips:
本案例中通过强制上线就成功恢复服务器数据的情况是非常少见的,多数存储都是在强制上线失败后进行复杂的存储结构研究和阵列信息分析和一系列的数据恢复操作才成功将数据恢复出来的。服务器管理员需要做好服务器数据备份,尽量避免不必要的支出和风险。