服务器存储数据恢复环境:
某单位一台某品牌型号为DS5300的服务器存储,1个机头+4个扩展柜,底层是2组分别由数十块硬盘组建的RAID5阵列。存储系统上层一共分了11个卷。
服务器存储故障&分析:
存储设备上一组raid5阵列上的2块磁盘出现故障,对应的硬盘指示灯亮黄灯,阵列崩溃,存储不可用。该组故障阵列上层存放的是Oracle数据库文件。
将故障阵列上所有磁盘标记后取出。首先由硬件工程师检测看是否有硬盘存在硬件故障,经过检测发现有2块硬盘存在坏道,SMART错误冗余级别已经超过阈值。以只读方式将检测正常的硬盘进行扇区级全盘镜像,针对2块有坏道的硬盘用专业工具处理并生成镜像文件。
收集&分析故障存储上的日志信息,找出两块硬盘的掉线时间,使用数据较新的硬盘恢复数据。
北亚企安数据恢复工程师通过前面的检测和分析,决定采用以下数据恢复方案:
方案一:将存储中所有硬盘备份后,通过该存储自带的管理软件强制上线。
方案二:分析硬盘底层数据,获取到重组RAID所需要的相关信息&重组RAID。从底层提取数据,重新加载oracle数据库,调试上层应用。
服务器存储数据恢复过程:
1、根据上述的第一种数据恢复方案,先在模拟器上进行测试。
2、测试没有问题后,通过存储设备自带的存储管理软件强制上线。强制上线后raid处于降级状态,设置好热备盘,让热备盘上线同步数据。
3、同步完成后,发现上层的卷可以直接使用,所有数据都可见,上层应用也能正常使用。
经过方案一的实施,上层应用可以直接启动,也不需要调试。
4、将卷里的文件都拷贝出来,移交给用户方。在数据恢复工程师的帮助下,将恢复出来的数据迁移到准备好的环境中,经过反复测试后,用户方确认恢复出来的数据完整有效,认可数据恢复结果。