服务器数据恢复环境&故障:
由于机房多次断电导致一台服务器中raid阵列信息丢失。该阵列中存放的是文档,上层安装的是Windows server操作系统,没有配置ups。
因为服务器异常断电重启后,raid阵列可以正常使用,所以未引起管理员的注意。后续出现的多次异常断电导致raid报错,服务器无法找到存储设备,进入raid管理模块进行任何操作都会导致操作系统死机。管理员尝试多次重启服务器,故障依旧。
服务器故障分析:
北亚企安数据恢复工程师在日常工作中经常碰到这类故障。出现这类故障的原因:1、管理员没有及时检修服务器设备状态,服务器在即将出现故障的时候没有及时处理。2、raid阵列一旦创建完成后,理论上raid信息不会改变,但是意外断电也可以导致raid信息丢失。
本案例中的故障情况极有可能就是服务器多次断电导致raid卡硬件损坏。
服务器数据恢复过程:
1、将故障服务器阵列中所有磁盘编号后取出,由硬件工程师检测后没有发现有硬盘存在硬件故障。以只读方式将所有磁盘做扇区级别的全盘镜像,在镜像过程中观察这些硬盘的物理状态,确认无物理故障。镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有硬盘底层数据,结合文件系统存储规则分析获取到该raid阵列中的raid数据块大小、raid盘序以及raid校验方式。使用分析得到这些raid信息虚拟重组raid阵列。
3、重组完raid磁盘阵列后进行逻辑校验,校验无误后再交由用户方进行验证。
4、用户仔细验证后,确认服务器raid阵列中的数据已经恢复到故障前的状态,本次服务器数据恢复工作完成。