infortrend ESDS RAID6 数据恢复过程

简介:

 [数据恢复故障描述]
  见<infortrend ESDS RAID6故障后的数据恢复方案>文章中的描述,infortrend ESDS-S12F-G1440存储,内接12块2TB硬盘组成RAID6,一个GPT分区,文件系统为NTFS,大小为18.2TB。3块硬盘离线后强制激活,并做了几分钟REBUILD,发现数据出错。

[数据恢复过程]

    1、使用DELL R720为恢复服务器平台,安装WINDOWS 2008R2系统。在DELL R720服务器内加DELL H200 6G扩展卡,在H200上接2组DELL MD1200磁盘阵列。A组MD1200连接所有12块2T源盘,B组接12块2T目标硬盘。

    2、保持A组所有磁盘在WINDOWS2008 R2中脱机,激活所有B组硬盘。使用北亚磁盘镜像工具对所有A组12块硬盘一对一镜像到B组12块硬盘。

    3、镜像完成后,关机,将源盘全部拿下,封存好,不再操作源盘。

    4、使用磁盘编辑器,对12块镜像盘做结构分析,发现每块硬盘前部具有明显RAID信息的痕迹,按查找确定RAID中LUN的起始分配位置。

    5、进行RAID6算法猜测推断,发现其基于标准P与另一个未知算法法则Q的右异步。但套用 里德-所罗门(Reed-solomon)算法不符合,按互联网上所有资料分析,基于PQ均等螺旋分布的RAID6只有里德-所罗门(Reed-solomon)算法 ,怀疑为其变种,但存在同一条带全0位置计算后非全0的情况,故推翻此判断。

    6、结合对控制器的测试,发现其Q校验基于一种随机的xor,如同Park编码,算法完全随机,但校验分布却完全不同于Park,所以即使思路类似,但算法却完全不同。

    7、需要事先得到12块盘中所有缺2块时的完整算法,共有C(12,2)=66种缺盘情况,每一种至少需要16种运算规则,经程序运行后(因运算复杂,人工无法证明),发现为了得到一个单元,大约要运算30-50次xor。

    8、用程序生成的运算公式,有140多K大小,即总计约14万字符。如此复杂的运算会对数据恢复周期带来影响,需要优化算法。

    9、优化算法模块,引入可以简化算法的中间变量层,将算法压缩至原来的约50%(明文)。

    10、针对一个明显不同步的数据块区,编写了一段程序,对所有C(12,2)进行计算,再将计算后的结果与预想结果进行比较。经历这样的几个过程,明确掉线盘0号与3号盘。

    11、对算法进行二进制优化,所有运算放弃STL,改用数组,并使用bitmap的理念表示表达式中的所有成员,实现算法的最大性能。

    12、按算法和分析出的结构对数据进行初步分析,未发现明显数据异常。

    13、生成数据到另一个20T的目标存储。

    

[数据恢复耗时]

    磁盘镜像:7小时

    分析算法:断断续续花费约60天。这个工程是我从业以来付出最长周期的工程,鉴于一个完全破天荒的算法,极大的算法研究热情支撑我编写了近万行代码进行判断、分析、优化、测试、恢复。感谢用户信赖北亚数据恢复中心,给予我们足够的时间。(结构及部分算法过程我会发布另一博文对其表述)

   导出数据:约100小时

 

[数据恢复结果]

    100%数据恢复成功(不排除有部分数据有少许损坏,但截止发稿,抽查验证的数据全部无异常)





本文转自 张宇 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/1180307,如需转载请自行联系原作者
目录
相关文章
|
5月前
|
存储 算法 数据挖掘
服务器数据恢复-昆腾存储StorNext文件系统数据恢复案例
昆腾某型号存储,StorNext文件存储系统。 共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。 存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。 存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。
服务器数据恢复-昆腾存储StorNext文件系统数据恢复案例
|
2月前
|
存储 算法 数据库
【服务器数据恢复】raid5多块硬盘离线导致昆腾存储崩溃的数据恢复案例
10个磁盘柜,每个磁盘柜配24块硬盘。9个磁盘柜用于存储数据,1个磁盘柜用于存储元数据。 元数据存储中24块硬盘,组建了9组RAID1阵列+1组RAID10阵列,4个全局热备硬盘。 数据存储中,组建了36组6硬RAID5,36组RAID5阵列划分为2个存储系统。其中1个存储系统中的一组RAID5中有2块硬盘先后出现故障离线,RAID5阵列不可用,存储系统崩溃。
【服务器数据恢复】raid5多块硬盘离线导致昆腾存储崩溃的数据恢复案例
|
5月前
|
存储 数据挖掘
服务器数据恢复—EMC存储raid5阵列瘫痪的数据恢复案例
服务器存储数据恢复环境: EMC某型号存储,8块组建一组raid5磁盘阵列。上层操作系统采用zfs文件系统。 服务器存储故障&分析: raid5阵列中有2块硬盘未知原因离线,raid5阵列崩溃,上层应用无法正常使用。
服务器数据恢复—EMC存储raid5阵列瘫痪的数据恢复案例
|
6月前
|
存储 Linux 数据库
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
服务器数据恢复环境: IBM某型号存储,6块sas硬盘组建一组raid5,划分一个lun分配给Linux服务器并格式化为OCFS2文件系统,共享给虚拟化使用,存放的数据包括24台liunx和windows虚拟机、压缩包文件和配置文件。 服务器故障: raid5阵列中成员盘坏了多块,阵列失效,数据丢失。
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
|
7月前
|
存储 固态存储 数据安全/隐私保护
北亚企安数据恢复-VSAN数据恢复方案
存储介质清单 :一共8台服务器节点,每节点2个磁盘组,其中1个磁盘组配置1块SSD固态硬盘,4块1.2T机械硬盘;另一个磁盘组配置1块SSD固态硬盘,4块2T机械硬盘。共计16块SSD固态硬盘和64块机械硬盘。 故障描述:一个节点服务器掉线,导致部分虚拟机无法访问。 期望恢复数据:恢复VSAN环境中故障虚拟磁盘数据。
|
7月前
|
运维
服务器数据恢复-RAID5常见故障&raid5数据恢复方案
raid5阵列常见故障: 1、服务器硬件故障或者RAID阵列卡故障; 2、服务器意外断电导致的磁盘阵列故障; 3、服务器RAID阵列阵列磁盘出现物理故障,如:电路板坏、磁头损坏、盘面划伤、坏扇区、固件坏等; 4、误操作导致磁盘盘序出现错误; 5、raid在同步数据或者重建过程中,同组raid阵列中又有其他硬盘掉线导致同步失败。
|
存储 算法 Windows
存储数据恢复方法_infortrend ESDS RAID6故障导致数据丢失恢复方案书
[用户单位]XXX影音制作公司 [数据恢复故障描述] 一台infortrend ESDS-S12F-G1440存储,内接12块2TB硬盘组成RAID6,整个RAID6的所有空间划分给一个LUN,映射到WINDOWS系统上。
1392 0