存储数据恢复方法_infortrend ESDS RAID6故障导致数据丢失恢复方案书-阿里云开发者社区

开发者社区> 北亚企安> 正文

存储数据恢复方法_infortrend ESDS RAID6故障导致数据丢失恢复方案书

简介: [用户单位]XXX影音制作公司 [数据恢复故障描述] 一台infortrend ESDS-S12F-G1440存储,内接12块2TB硬盘组成RAID6,整个RAID6的所有空间划分给一个LUN,映射到WINDOWS系统上。
+关注继续查看

[用户单位]
XXX影音制作公司

[数据恢复故障描述]
一台infortrend ESDS-S12F-G1440存储,内接12块2TB硬盘组成RAID6,整个RAID6的所有空间划分给一个LUN,映射到WINDOWS系统上。在WINDOWS系统上,划分了一个GPT分区,大小为18.2TB,原已用空间约16.5TB。
在使用一段时间后发现存储无法访问,管理人员查看存储发现3块硬盘离线,之后通过一些非常规手段促使存储上线,并开始rebuild。但通过主机访问时发现,分区打不开,所有数据均无法访问。咨询专业机构后得知此状况表明数据已存在破坏,为避免状态的进一步恶化,中止rebuild,关机后寻求专业数据恢复机构帮助。
经当地数据恢复公司全力恢复后,最终的结果是有大量数据丢失,大量数据无法打开。

[数据恢复分析]
RAID6是支持两块硬盘同时掉线的一种存储冗余模式,但当两块以上的磁盘下线后,RAID6便无法正常工作了。通常情况下,RAID6离线的3块盘是间隔一段时间内先后出现故障的,所以,在这种情况下,如果将早掉线的盘(陈旧的数据)上线,便会与在线的盘(新鲜的数据)进行RAID6算法同步,导致数据不伦不类,无法正常读取数据。
本例中应为上述分析,但因rebuild时间较短(约几分钟),在几分钟内,大约可以同步几十GB数据,本例用户数据文件数据非常多,同时做为素材库,文件系统最前部存储老数据的可能性最大,另因文件数量多,所以一些较新的文件的目录及节点索引应该都位于磁盘后部,所以同步操作可能对存储的影响不大,推断破坏有限。

[数据恢复方案]
1、为避免故障扩大,首先对故障硬盘做完全扇区级克隆。如部分硬盘有物理故障,交由硬件恢复组解决硬件故障。
2、分析存储使用的的RAID6算法,再按此算法对12块硬盘做C(12,2)共66种可能的缺2盘的情况组合。人工或通过程序判定最正确的缺盘可能。
3、通过北亚RAID数据恢复软件或第三方数据恢复软件搭建虚拟RAID平台,按分析出的缺盘状态、盘序、块大小、校验方向、RAID6算法构建进行附加。
4、对虚拟RAID,进行GPT分区结构解释,然后进行文件系统解释,确定算法是否正确。如不正确,调整算法,直到最佳结构。
5、按文件或扇区方式迁移数据到另一存储,完成恢复工作。

[数据恢复时间预计]
镜像时间:8小时内(12个并行流程同时镜像,以每个流程60M/S的速度计)
分析及验证算法:2-4小时
迁移数据:15天(文件方式迁移) 或3天(扇区方式迁移,必须目标存储大于等于源故障存储,同时文件系统无严重破坏)

[应急建议]
故障发生后,应在关机状态下插拔硬盘,同时对硬盘原位置进行标注。在硬盘离开存储后,不要再对存储加电。确保所有操作尽可能可回溯。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
15 年老兵谈阿里云大规模机器学习实践
  近年来,机器学习技术的发展归因于我们有极其庞大的数据用来训练算法。当企业需要落地大规模机器学习时,往往会面临很多难题,如何解决这些问题?如何系统了解大规模机器学习落地的技巧?其适用场景是什么?InfoQ 希望通过该选题解决这些问题,并推动企业在大规模机器学习方面的实践。本文,InfoQ 有幸采访了阿里云机器学习研究员林伟,听他分享自己的经验和见解。
3 0
与数据隐私相关的 AI 关键问题
  本文最初发表在 Towards Data Science 博客,经原作者 Alexandros Zenonos 授权,InfoQ 中文站翻译并分享。   隐私不仅是与人工智能有关的问题,也是任何与数据相关的领域普遍关注的问题。隐私是关于人们对其个人数据和基于这些数据所做的决定的控制。
5 0
如果你有拖延症,程序员不如试试这个技巧提升效率?
  要吃掉一头大象,每次吃一口。   ——克雷顿·艾布拉姆斯(Creighton Abrams)   造成拖延的首要原因之一,同时也是造成生产力低下的祸根,就是总是在感慨一个问题:好忙啊,问题好大啊……实际上,你并没有真正试着去解决问题。当我们从任务的全貌来审视任务的时候,它们看起来比真实情况都要大,并且更吓人。   在本文中,我会谈及一个能够帮助你克服拖延的提高生产力的窍门:分解任务。通过将大任务分解为小任务,你会发现自己更有动力去完成它们,也更加稳妥地向着目标前进。
5 0
程序员真的是吃青春饭吗?如何面对传说中的 35 岁职业焦虑?
  正走在这条路上的你或许也曾想过这些问题。这一次,力扣邀请到了《高效制胜——程序员面试典型题解》作者吴江(迈克老师),分享他 35 岁跳槽,并拿到了技术负责人 Offer,实现收入增长的故事和面试准备经验。   — 01 —   “35 岁危机”真有那么可怕吗?   在 2018 年快过春节的时候,我们部门突然被通知要开一个会,会上通知我们部门要在明年的这个时候被整体裁掉。我在这家五百强外企已经待了五年,当时虽然有这个预感,但是真的听到正式通知时,不免还是感觉有点震惊。
3 0
使用 Go 语言编写的恶意软件激增 2000%
  近日,网络安全公司 Intezer 发布了 2022 年基于 Go 语言恶意软件的报告。报告指出:恶意软件的开发者已经从 C 和 C++ 逐渐转向 Go 语言,自 2017 年以来,基于 Go 语言的恶意软件数量呈现爆发式增长,增幅超过了 2000%。   自从 2012 年发现了第一个使用 Go 语言编写的恶意软件之后,Go 语言就在恶意软件领域渐渐流行起来了。2019 年 7 月,Palo Alto Networks 发布了一份使用 Go 语言编写的恶意软件分析报告。报告发现,2019 年以前使用 Go 语言编写恶意软件是一件罕见的事情,但到了 2019 年,这种情况每天都会发生,2
3 0
Android WebSocket即时通信
  HTTP与WebSocket响应方式区别   WebSocket存在的理由   我们已经有了 HTTP 协议,为什么还需要另一个协议?因为只靠Http通信有一个缺陷:通信只能由客户端发起,HTTP 协议做不到服务器主动向客户端推送信息。这种单向请求的特点,注定了如果服务器有连续的状态变化,服务端想主动通知客户端,就难以实现。因此,工程师们一直在思考,有没有更好的方法,而 WebSocket 就是这样诞生的。
1 0
ESC初体验的感受
ESC的初次使用感受
12 0
Keras之父写给年轻程序员的33条忠告
  代码是一种交流方式,Keras 之父 Fran?ois Chollet 在本文中为我们总结了在开发过程中、API 设计中及软件职业生涯中应该关注哪些要点。原则是形式化的直觉,比原始模式识别适用于更广泛的情况,Fran?ois Chollet 的这份原则清单将带你领略大师的品味。
4 0
+关注
55
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载