服务器故障:
服务器中有一组由多块硬盘组建的raid5磁盘阵列,服务器阵列中2块硬盘先后掉线导致服务器崩溃。
服务器数据恢复过程:
1、将故障服务器中所有磁盘编号后取出,由硬件工程师对掉线的两块磁盘进行物理故障检测,发现硬盘加电后磁头无法寻道,分离PCB并清洁HDA组件后再次尝试加电依然不能寻道,只能在无尘车间中对故障硬盘进行物理修复。修复完成后将所有磁盘以只读方式做扇区级全盘镜像,镜像完成后按照编号将所有磁盘还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘底层数据,北亚企安数据恢复工程师发现0扇区均出现了“55 AA”(0x01C2H处表示该分区的类型,这里显示“05”,代表这是一个扩展分区。所以该MBR分区结构状态不正常)。除了8号硬盘是一个正常的MBR分区,其0x01C6处数值代表指向的下一个扇区为GPT的头部。
7号硬盘0x01C6处数值代表指向下一个扇区,但是下一个扇区很明显不是GPT的头部。
根据上面的情况可以初步判断该阵列中8号盘和7号盘分别为第一块盘和最后一块盘,GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。
3、通过分析得知该阵列条带大小为1024个扇区。按照1024扇区分割,一个记录为一个条带的大小,并且有7块盘跳到同一记录。当7块盘都定位到同一位置时,通过对比可以判断校验区的走向,继而判断整个RAID5阵列的走向。
4、将前面判断为第一块盘的8号盘放在第一个位置,确定RAID5阵列为左走向和盘序。
5、前面已经初步确定了LUN的起始扇区是172032扇区。跳到172032扇区对硬盘的使用情况进行观察,正常情况下这个扇区所属条带中的5号盘应该是校验区,但实际情况却显示校验区为8号盘。根据该raid左走向的规律,5号盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为5号盘。因此可以确定LUN的起始扇区为171008扇区。
6、按照确定的盘序重组raid。选择RAID5、Stripe size 512KB、左异步,点击Build开始重组。
7、完成raid的重组后,由于数据从1024*8=8192个扇区开始,所以RAID的起始扇区(Start sectors)选择8192。
重组后的raid5磁盘阵列:
8、RAID5磁盘阵列重组完成后,用户方经过验证没有发现问题,认可数据恢复结果。本次服务器数据恢复成功。