服务器数据恢复环境:
一台服务器中有一组由4块SCSI硬盘组建的raid5磁盘阵列,划分了一个逻辑卷,操作系统为WINDOWS SERVER,作为SQL SERVER服务器使用。
服务器故障:
运行过程中该服务器raid5磁盘阵列瘫痪,管理员检查服务器发现raid5阵列中已经有3块磁盘离线。管理员选择其中2块离线硬盘进行强制上线操作,强制上线后操作系统无法启动。使用WINPE光盘启动操作系统后,可以看到数据。
管理员将备份好的数据库文件压缩成zip格式的压缩包拷贝到移动硬盘上,从移动硬盘拷贝到其他服务器上进行测试,发现备份文件无法正确解压但文件大小、名称都正确。
联系第三方的服务器维保公司更换故障服务器中的raid卡,然后重建一组raid5阵列。在raid上层重装系统后服务器能够正常进入系统并正常工作,这时候试图修复zip文件中的数据库,但是没有成功。
这个案例的完全不同于北亚企安数据恢复中心之前分享的服务器数据恢复案例,因为本案例中的数据遭到了严重破坏,无法按照用户方的要求恢复服务器中的数据。
本案例服务器数据无法恢复的原因分析和raid5磁盘阵列数据安全Tips:
1、对于raid5阵列来说,一旦发现有一块硬盘离线,即使服务器可以运行,也要及时备份数据,备份完成后对出现故障的磁盘阵列进行rebuild。等到服务器瘫痪后再对raid进行检查维护已经是事后补救了,数据恢复的难度也变大。
2、如果raid5阵列中有2块以上硬盘离线,切记不可随意选择硬盘上线。如果在选错盘启动系统有可能导致raid状态改变,破坏磁盘阵列中的重要数据,导致数据恢复失败。
3、只要目录区正常或者部分正常,就可以在PE中查看到目录,但这不等同于数据区完全正常。本案例中系统无法启动就是强制上线操作错误导致的。管理员在PE里读到目录,实际上已经载入了文件系统,破坏了文件系统的元数据区。
4、ZIP文件无法解压的原因是RAID结构错误。管理员强制上线了2块硬盘,此时共有3块盘在线(1块正常的+2块强制上线的),这3块磁盘中有一块是先离线的磁盘,这就导致新数据与先离线盘中的旧数据混在一起。此时虽然目录正确但数据区是混乱的,如果不将这3块盘进行完整数据同步,还是非常有可能完整恢复数据。
5、如果自己无法解决raid5阵列出现的故障,求助维保公司解决问题时要注意合同中确定有数据恢复的项目,通常维保公司只关心硬件故障的解决,不关心其中的数据。如果第三方公司没有数据恢复的服务范围,那么选择专业的数据恢复机构。
6、导致本案例服务器raid5阵列数据无法恢复的操作就是重建RAID5。该型号服务器使用ServeRAID Support CD重建RAID时,默认会将所有数据清0。其他型号的服务器通常也会在重建raid时重新同步校验,打乱原有数据结构。
不过完整同步的过程需要一定的时间,如果在同步没有完成的情况下中断同步,还是可以对未同步的剩余数据进行恢复的。但是本案例中RAID成员盘都已经同步完成了,数据已经完全毁了。