raid5数据恢复—EMC存储上raid5阵列数据恢复案例

简介: 某单位一台EMC某型号存储中有12块STAT接口的硬盘,其中10块硬盘组建了一组RAID5阵列,剩下2块设置为热备盘使用。RAID5阵列中的2块硬盘出现故障离线,但是只有一块热备盘成功激活,导致RAID5阵列不可用,上层LUN无法使用。

存储数据恢复环境&故障:
某单位一台EMC某型号存储中有12块STAT接口的硬盘,其中10块硬盘组建了一组RAID5阵列,剩下2块设置为热备盘使用。
RAID5阵列中的2块硬盘出现故障离线,但是只有一块热备盘成功激活,导致RAID5阵列不可用,上层LUN无法使用。

存储数据恢复过程:
1、将故障存储设备中所有硬盘编号后取出,硬件工程师对所有磁盘做检测后没有发现有硬盘存在物理故障。使用坏道检测工具检测也没有发现有硬盘存在坏道。
2、将所有磁盘以只读方式进行全盘镜像,由于源磁盘的扇区大小为520字节,镜像完成后将所有备份数据做520字节 to 512字节的转换,便于后续的数据恢复。
3、上述步骤的检测并没有发现有磁盘存在物理故障或者是坏道,北亚企安数据恢复工程师推断导致故障发生的原因是某些磁盘读写不稳定。由于EMC存储的控制器针对磁盘的检查策略比较严格,一旦检测到某些磁盘性能不稳定,EMC存储上的控制器就很大可能性将这些磁盘识别为坏盘,并踢出RAID。一旦RAID中掉线的盘数到达到该级别RAID所允许掉盘的最大数量,RAID就会崩溃,上层基于RAID的LUN也将不可用。本案例中基于RAID的LUN只有一个,分配给SUN小机使用,上层文件系统为ZFS。
4、EMC存储的LUN是基于RAID的。分析每一块磁盘,发现其中有2块盘完全没有数据。从存储管理系统上发现这2块盘都是热备盘,其中一块盘替换了一块坏盘。虽然该块热备盘成功激活,但级别为RAID5的RAID中还缺失一块硬盘,导致数据没有同步到这块激活的热备盘中。分析其他10块硬盘,分析数据在硬盘中分布的规律、RAID条带的大小、盘序等重组raid所需的raid相关信息。
5、根据分析获取到的RAID信息虚拟重组RAID。但由于RAID中有两块盘掉线,因此需要分析这两块硬盘掉线顺序。分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘是先掉线的,通过RAID校验程序校验这个条带,确定先掉线的硬盘。
6、LUN是基于RAID的,根据上述分析出来信息重组RAID。分析LUN在RAID中的分配信息和LUN分配的数据块MAP。根据这些信息使用北亚企安自主开发的raid恢复程序,解释LUN的数据MAP并导出LUN的所有数据。
7、使用ZFS文件系统解释程序对生成的LUN做文件系统解释,解释某些文件系统元文件的时候程序报错。北亚企安开发工程师对ZFS文件系统解释程序做debug调试,分析程序报错原因。经过数小时的分析与调试,发现存储突然出现故障导致ZFS文件系统中某些元文件损坏,从而导致正常解释。
8、由于ZFS文件系统部分元文件损坏,因此需要先修复这些损坏的文件系统元文件,然后才能正常解析ZFS文件系统。北亚企安数据恢复工程师手工修复这些损坏的元文件,直到ZFS文件系统能够正常解释。对修复好的ZFS文件系统做解析,解析所有文件节点及目录结构。
9、用户方工程师对恢复出来的数据进行验证,经过验证确认恢复出来的数据完整可用。本次数据恢复工作完成。

相关文章
|
8月前
|
机器学习/深度学习 供应链 监控
如何通过API优化电商库存管理,减少缺货风险
本文详解如何通过API优化电商库存管理,实现库存实时同步、需求预测与自动化补货,降低缺货风险,提升运营效率及客户满意度。
535 0
|
8月前
|
数据采集 算法 数据挖掘
模块化控制协议(MCP)在网络中增强智能体执行效率的研究
随着Web3技术的迅速发展,去中心化应用和智能体在各种领域的应用逐渐增多。MCP(Modularized Control Protocol,模块化控制协议)作为一种增强智能体执行能力的关键技术,为Web3场景中的智能体提供了更强的灵活性和可扩展性。本文将探讨如何利用MCP技术提升智能体在Web3场景中的执行能力,并通过实例代码展示其实现路径。
757 22
|
8月前
|
存储 缓存 资源调度
《破局节点失效:Erlang分布式容错系统的自愈机制与恢复逻辑》
Erlang凭借并发设计与原生分布式支持,成为构建容错系统的利器。面对节点故障常态,系统需实现自动恢复闭环:从多层监控、预测性降级,到状态持久化、事务续接,再到级联恢复与智能调度,层层机制保障服务无缝切换。结合Mnesia事务日志、supervisor监督模式与进程模型优势,Erlang将故障恢复深度融入系统运行,实现高可用与“零感知”体验。
471 4
|
8月前
|
XML 安全 数据安全/隐私保护
Okta核心协议SAML
SAML(安全断言标记语言)是一种开放标准,用于在身份提供商和服务提供商之间安全传递用户身份和权限信息,常用于实现单点登录(SSO),提升用户体验与安全性,简化企业用户管理。
796 89
|
8月前
|
存储 缓存 API
信息检索重排序技术深度解析:Cross-Encoders、ColBERT与大语言模型方法的实践对比
本文将深入分析三种主流的重排序技术:Cross-Encoders(交叉编码器)、ColBERT以及基于大语言模型的重排序器,并详细阐述各方案在实际应用中的性能表现、成本考量以及适用场景。
659 3
信息检索重排序技术深度解析:Cross-Encoders、ColBERT与大语言模型方法的实践对比
|
8月前
|
数据采集 人工智能 自然语言处理
豆蔻妇科大模型再突破:钉钉行业训练平台+精标数据SFT ,准确率从 77.1%上升至 90.2%
在医疗AI领域,通用大模型因缺乏专业临床判断力而难以胜任复杂诊断任务。本文以豆蔻妇科大模型为例,介绍了通过监督微调(SFT)显著提升诊断准确率的实践路径。从初始77.1%到最终90.2%的突破,依托高质量数据筛选、思维链校准、双重评估体系及钉钉训练平台支持,展示了医疗大模型从“知其然”到“知其所以然”的演进过程,并展望SFT+RL协同训练的未来发展。
675 59
|
8月前
|
Web App开发 安全 算法
什么是一次性密码(OTP)
一次性密码(OTP)是一种动态生成的临时身份验证代码,仅能使用一次且有效期短,通常为30-60秒。它作为多因素认证的重要组成部分,通过设备或应用生成唯一代码,提升账户安全性,减少密码重用和拦截风险,广泛应用于金融、企业安全、电商等领域。
3755 87
|
8月前
|
小程序 安全 JavaScript
构建即时通讯APP内的小程序生态体系:从架构设计到技术实现-优雅草卓伊凡
构建即时通讯APP内的小程序生态体系:从架构设计到技术实现-优雅草卓伊凡
661 1
构建即时通讯APP内的小程序生态体系:从架构设计到技术实现-优雅草卓伊凡
|
8月前
|
消息中间件 缓存 负载均衡
构建高效可扩展的后端架构:从设计到实现
本文探讨了如何构建高效、可扩展的后端架构,涵盖需求分析、系统设计、实现与优化全过程。内容包括微服务、数据库设计、缓存与消息队列等关键技术,并涉及API设计、自动化测试、CI/CD及性能优化策略,助力打造高性能、易维护的后端系统。
|
7月前
|
缓存 前端开发 IDE
硬盘数据恢复—硬盘物理故障判定妙招
硬盘的物理结构可以分为外部结构和内部结构。外部结构主要包括硬盘的外壳和电路板,硬盘的外部物理故障通常是电路板故障。 硬盘的电路板上分布着主控芯片、缓存、电机驱动芯片、BIOS及其他电子元器件。在电路板前端还有硬盘的电源接口和数据线接口。这些电路板上的元器件都有出现故障的可能。

热门文章

最新文章