infortrend ESDS RAID6故障后的数据恢复方案

简介:
[数据恢复故障描述]
  一台infortrend ESDS-S12F-G1440存储,内接12块2TB硬盘组成RAID6,整个RAID6的所有空间划分给一个LUN,映射到WINDOWS系统上。在WINDOWS系统上,划分了一个GPT分区,大小为18.2TB,原已用空间约16.5TB。
    在使用一段时间后发现存储无法访问,管理人员查看存储发现3块硬盘离线,之后通过一些非常规手段促使存储上线,并开始rebuild。但通过主机访问时发现,分区打不开,所有数据均无法访问。咨询专业机构后得知此状况表明数据已存在破坏,为避免状态的进一步恶化,中止rebuild,关机后寻求专业数据恢复机构帮助。
  经当地数据恢复公司全力恢复后,最终的结果是有大量数据丢失,大量数据无法打开。 

[数据恢复分析]
  RAID6是支持两块硬盘同时掉线的一种存储冗余模式,但当两块以上的磁盘下线后,RAID6便无法正常工作了。通常情况下,RAID6离线的3块盘是间隔一段时间内先后出现故障的,所以,在这种情况下,如果将早掉线的盘(陈旧的数据)上线,便会与在线的盘(新鲜的数据)进行RAID6算法同步,导致数据不伦不类,无法正常读取数据。
    本例中应为上述分析,但因rebuild时间较短(约几分钟),在几分钟内,大约可以同步几十GB数据,本例用户数据文件数据非常多,同时做为素材库,文件系统最前部存储老数据的可能性最大,另因文件数量多,所以一些较新的文件的目录及节点索引应该都位于磁盘后部,所以同步操作可能对存储的影响不大,推断破坏有限。
 
[数据恢复方案]
    1、为避免故障扩大,首先对故障硬盘做完全扇区级克隆。如部分硬盘有物理故障,交由硬件恢复组解决硬件故障。
    2、分析存储使用的的RAID6算法,再按此算法对12块硬盘做C(12,2)共66种可能的缺2盘的情况组合。人工或通过程序判定最正确的缺盘可能。
    3、通过北亚RAID数据恢复软件或第三方数据恢复软件搭建虚拟RAID平台,按分析出的缺盘状态、盘序、块大小、校验方向、RAID6算法构建进行附加。
    4、对虚拟RAID,进行GPT分区结构解释,然后进行文件系统解释,确定算法是否正确。如不正确,调整算法,直到最佳结构。
    5、按文件或扇区方式迁移数据到另一存储,完成恢复工作。
 
[数据恢复时间预计]
  镜像时间:8小时内(12个并行流程同时镜像,以每个流程60M/S的速度计)
    分析及验证算法:2-4小时
    迁移数据:15天(文件方式迁移)  或3天(扇区方式迁移,必须目标存储大于等于源故障存储,同时文件系统无严重破坏)
 
[应急建议]
    故障发生后,应在关机状态下插拔硬盘,同时对硬盘原位置进行标注。在硬盘离开存储后,不要再对存储加电。确保所有操作尽可能可回溯。  




本文转自 张宇 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/1177346,如需转载请自行联系原作者
目录
相关文章
|
4月前
|
运维 算法 数据挖掘
服务器数据恢复-服务器raid6磁盘阵列数据恢复案例
服务器数据恢复环境: 服务器上有一组由12块硬盘组建的raid6磁盘阵列,raid6阵列上层有一个lun,映射到WINDOWS系统上使用,WINDOWS系统划分了一个GPT分区。 服务器故障&分析: 服务器在运行过程中突然无法访问。对服务器进行检测后,工作人员发现服务器raid6阵列中有3块磁盘处于离线状态,于是将这3块磁盘强制上线并进行rebuild操作,但是强制上线成功后分区打不开,数据无法访问。
|
1月前
|
存储 算法 数据库
【服务器数据恢复】raid5多块硬盘离线导致昆腾存储崩溃的数据恢复案例
10个磁盘柜,每个磁盘柜配24块硬盘。9个磁盘柜用于存储数据,1个磁盘柜用于存储元数据。 元数据存储中24块硬盘,组建了9组RAID1阵列+1组RAID10阵列,4个全局热备硬盘。 数据存储中,组建了36组6硬RAID5,36组RAID5阵列划分为2个存储系统。其中1个存储系统中的一组RAID5中有2块硬盘先后出现故障离线,RAID5阵列不可用,存储系统崩溃。
【服务器数据恢复】raid5多块硬盘离线导致昆腾存储崩溃的数据恢复案例
|
2月前
|
存储 算法 关系型数据库
【服务器数据恢复】服务器raid6磁盘阵列数据恢复案例
一台网站服务器中有一组由6块磁盘组建的RAID6磁盘阵列,操作系统层面运行MySQL数据库和存放一些其他类型文件。
|
2月前
|
存储 运维 数据挖掘
【服务器数据恢复】断电导致服务器RAID故障的数据恢复案例
某品牌服务器中有一组由数块SAS硬盘组建的RAID5磁盘阵列,服务器操作系统是WINDOWS SERVER,服务器中存放企业数据,无数据库文件。 服务器出故障之前出现过几次意外断电的情况,服务器断电重启后没有发现异常,直到最后一次断电重启后RAID报错:“无法找到存储设备”,进入RAID管理模块后进行任何操作都会死机,服务器管理员多次重启服务器仍然无法进入系统。为了防止服务器内数据丢失,管理员联系我们数据恢复中心寻求帮助。
|
4月前
|
数据挖掘
北亚服务器数据恢复-服务器断电导致raid5数据丢失的数据恢复案例
服务器数据恢复环境: 服务器有一组由12块硬盘组建的raid5阵列。 服务器故障&分析: 机房供电不稳导致服务器意外断电,工作人员重启服务器后发现服务器无法正常使用。 根据故障情况,北亚企安数据恢复工程师初步判断服务器故障原因是意外断电导致的raid模块损坏,经过详细检测发现是异常断电导致的raid信息丢失。raid信息丢失实际上是raid模块损坏的一种情况。
|
4月前
|
运维 Oracle 关系型数据库
服务器数据恢复-raid5故障导致上层oracle数据库故障的数据恢复案例
服务器数据恢复环境: 一台服务器中有一组由24块FC硬盘组建的raid5磁盘阵列,linux操作系统+ext3文件系统,服务器上层部署有oracle数据库。 服务器故障&检测: raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正常使用。 通过管理后台查看服务器中硬盘的状态,显示有两块硬盘处于离线状态。
|
4月前
|
存储 数据挖掘
服务器数据恢复—EMC存储raid5阵列瘫痪的数据恢复案例
服务器存储数据恢复环境: EMC某型号存储,8块组建一组raid5磁盘阵列。上层操作系统采用zfs文件系统。 服务器存储故障&分析: raid5阵列中有2块硬盘未知原因离线,raid5阵列崩溃,上层应用无法正常使用。
服务器数据恢复—EMC存储raid5阵列瘫痪的数据恢复案例
|
4月前
|
存储 数据挖掘
Vsan数据恢复—vSAN逻辑架构出现故障的数据恢复案例
一台存储采用了VSAN分布式存储架构,存储内共有24块硬盘存储数据。 这台vSAN存储设备关机重启。经过数据恢复工程师的检测,发现vSAN逻辑架构出现故障,上层虚拟机瘫痪,存储内的数据丢失。
|
5月前
|
存储 Linux 数据库
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
服务器数据恢复环境: IBM某型号存储,6块sas硬盘组建一组raid5,划分一个lun分配给Linux服务器并格式化为OCFS2文件系统,共享给虚拟化使用,存放的数据包括24台liunx和windows虚拟机、压缩包文件和配置文件。 服务器故障: raid5阵列中成员盘坏了多块,阵列失效,数据丢失。
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
|
6月前
|
存储 固态存储 数据安全/隐私保护
北亚企安数据恢复-VSAN数据恢复方案
存储介质清单 :一共8台服务器节点,每节点2个磁盘组,其中1个磁盘组配置1块SSD固态硬盘,4块1.2T机械硬盘;另一个磁盘组配置1块SSD固态硬盘,4块2T机械硬盘。共计16块SSD固态硬盘和64块机械硬盘。 故障描述:一个节点服务器掉线,导致部分虚拟机无法访问。 期望恢复数据:恢复VSAN环境中故障虚拟磁盘数据。