在服务器磁盘阵列出现故障以后,一般情况下会采用两种方法来处理:一是设备厂家对故障设备进行处理及恢复,比如更换坏件、重配Raid等;二是找专业的数据恢复公司来处理,先把重要数据恢复出来,然后才进行硬件设备维修。
有个数据恢复案例硬件信息及故障如下:
由14块盘做成的HP阵列柜,其中13块盘做成Raid5,有1块硬盘是热备。14块盘的硬盘指示灯均显示绿灯正常,在操作系统中的磁盘管理界面能看到阵列盘,但都显示为不可识别的硬盘。本案例故障属于磁盘阵列(Raid)信息故障。磁盘阵列信息存储在HP阵列卡上,同时还在每个物理硬盘上存有备份。如果这两个信息不一致,或者其中一个损坏,就会出现本故障现象。
恢复方案:
方案1:重新配置或者修复Raid信息。这种方式方便快速,先查看现有阵列信息参数(磁盘顺序、块大小等),在原阵列卡上删除现有Raid信息,重新创建Raid5,配置的时候保留原有的Raid5参数。这种做法需要深入了解Raid卡,要知道阵列卡的每一个工作细节,特别注意该阵列卡在重新配置阵列的时候是否自动初始化阵列,是否破坏原有数据等等。所以这个方案具有一定的风险,但是这种恢复方式速度快,在特定情况下,需要论证该方案的可行性,如果可行就可以采用。
方案2:重新组合磁盘阵列上的数据到新的磁盘阵列上。本案例阵列卡安装在服务器上而不是在阵列柜中,我们把这个HP阵列柜挂接到一个带有SCSI接口的机器上,就能识别出14块独立的物理硬盘,这个操作不会对硬盘有任何的数据破坏。从14块独立的硬盘中分析出Raid5的数据组合方式(块大小、数据走向、硬盘顺序等),得出详细的组合参数以后,用“护航舰”Raid重组工具把Raid5的数据组合到新的磁盘阵列柜。本案例中单个物理硬盘容量300GB,总的磁盘阵列柜容量为4TB左右,重组数据需要花费比较长的时间,重组过程需要花费24-36小时的时间或者更长一些。本恢复方案没有数据破坏和丢失的风险,因为对原有的物理硬盘只进行读操作,但是花费的时间就长一些。
在实际恢复工程中,我们建议采用第2种方案进行数据恢复,在物理硬盘没有硬件损伤(硬盘不可识别)的情况下,方案2保证了数据100%的安全,也保证100%的恢复。方案1是在特殊条件下才能采用的,不能保证数据100%安全。
声明:作者达思数据恢复技术专家覃廷良,本文首发http://www.bnuol.com ,在donews.com,51cto,techweb,新浪,百度等数据恢复技术博客上转发.欢迎转发,转发请保留作者及出处。