服务器数据恢复—某品牌P2000服务器raid5阵列数据恢复案例

本文涉及的产品
无影云电脑个人版,1个月黄金款+200核时
无影云电脑企业版,4核8GB 120小时 1个月
资源编排,不限时长
简介: 服务器数据恢复环境:某品牌P2000服务器,有一组由数块硬盘组建的raid5磁盘阵列(有热备盘),部署了VMWARE ESX虚拟化平台,VMFS文件系统。服务器故障:服务器在正常运行中,raid5阵列有两块硬盘亮黄色故障灯。经用户方工作人员初步检测,亮黄色故障灯的硬盘出现物理故障,故障表现为:序列号无法读取,通过SAS扩展卡无法识别硬盘。

服务器数据恢复环境:
某品牌P2000服务器,有一组由数块硬盘组建的raid5磁盘阵列(有热备盘),部署了VMWARE ESX虚拟化平台,VMFS文件系统。

服务器故障:

服务器在正常运行中,raid5阵列有两块硬盘亮黄色故障灯。经用户方工作人员初步检测,亮黄色故障灯的硬盘出现物理故障,故障表现为:序列号无法读取,通过SAS扩展卡无法识别硬盘。

服务器数据恢复过程:
1、将故障服务器上所有磁盘编号后取出,然后由硬件工程师将那2块故障盘连接到SAS扩展卡上加电检测,结果磁头不寻道。硬件工程师将PCB分离,检查硬盘HDA组件发现氧化的情况。清洁后再次加电依然无法寻道。于是硬件工程师在北亚企安的无尘工作室对故障硬盘进行开盘操作。
硬件工程师将检测完好的备件盘开盘,拆取PCB替换掉故障盘的PCB,再将故障盘PCB上的ROM芯片拆掉替换到新的PCB上。再次将修复完成的故障硬盘加电检测,这回可以正常起转,磁头寻道声音正常,但是发出明显的敲盘声。由于热备盘的磁头与故障盘不匹配,于是另找同型号的磁头替换故障盘的磁头,这次硬盘可以正常识别。
将修复好的故障盘和其他完好的硬盘以只读方式做全盘镜像。镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、使用工具打开所有磁盘的镜像文件,发现所有硬盘的0扇区都有“55 AA”标志。0x01C2H处表示该分区的类型,0x01C2H处显示“05”意味着这是一个扩展分区。因此从0扇区看这是MBR分区结构异常。
继续查找,分别在另外2块磁盘(暂时称为a盘和b盘)找到了“55 AA”的标志。其中a盘的查询结果表示这是一个正常的MBR分区,其0x01C6处数值意味着指向的下一个扇区为GPT的头部。
1.jpg

查看b盘的0x01C6处数值,但是下一个扇区明显不是GPT的头部。
2.jpg

由此可以初步判断a盘是第一块盘,b是最后一块盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。
3、对故障服务器raid5阵列进行分析,发现raid条带大小为1024个扇区。按照1024扇区进行分割,使一个记录为一个条带的大小,所有盘跳到同一记录283123。
3.jpg

当所有盘都定位到同一位置时,通过对比可以判断校验区的走向,从而判断整个RAID5的走向。将判断出是第一块盘的a盘放在第一个位置,确定RAID5的走向和盘序。
4.jpg

4、跳到172032扇区对硬盘的使用情况进行观察,正常情况下这个扇区所属条带中的那块盘应该是校验区,但实际情况中却显示校验区为a盘。根据该raid左走向规律,172032扇区所属条带中的那块盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为172032扇区所属条带中的那块盘。因此可以确定LUN的起始扇区为171008扇区。
按照确定的盘序重组raid。
5.jpg

点击Build进行重组。组好raid后,由于数据从1024*8=8192个扇区开始,若工具没有跳转到此扇区的功能,那么刚组好的RAID必须和一个文件再进行一次Build重组操作。
重组后的raid5磁盘阵列:
6.jpg

5、RAID5磁盘阵列重建完成后由用户方进行验证,经过验证用户方确认数据完整有效。本次数据恢复工作完成。

相关文章
|
5天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
14天前
|
安全 数据挖掘
服务器数据恢复—RAID5阵列中两块硬盘离线导致阵列崩溃的数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中一块硬盘未知原因离线,热备盘自动激活上线替换离线硬盘。在热备盘上线过程中,raid5阵列中又有一块硬盘离线。热备盘同步失败,该raid阵列崩溃,LVM结构变得不完整,文件系统无法正常使用。
|
6天前
|
存储 数据挖掘
服务器数据恢复—ZFS文件系统下数据恢复案例
服务器存储数据恢复环境: ZFS Storage 7320存储阵列中有32块硬盘。32块硬盘分为4组,每组8块硬盘,共组建了3组RAIDZ,每组raid都配置了热备盘。 服务器存储故障: 服务器存储运行过程中突然崩溃,排除人为误操作、断电、进水和其他机房不稳定因素。管理员重启服务器存储,系统无法进入,需要恢复服务器存储中的数据。
|
1天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
8天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
9天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
12天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)
|
29天前
|
存储 人工智能 弹性计算
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
50 6
|
6天前
|
机器学习/深度学习 人工智能 编解码
阿里云GPU云服务器优惠收费标准,GPU服务器优缺点与适用场景详解
随着人工智能、大数据分析和高性能计算的发展,对计算资源的需求不断增加。GPU凭借强大的并行计算能力和高效的浮点运算性能,逐渐成为处理复杂计算任务的首选工具。阿里云提供了从入门级到旗舰级的多种GPU服务器,涵盖GN5、GN6、GN7、GN8和GN9系列,分别适用于图形渲染、视频编码、深度学习推理、训练和高性能计算等场景。本文详细介绍各系列的规格、价格和适用场景,帮助用户根据实际需求选择最合适的GPU实例。
|
8天前
|
弹性计算 Linux 数据安全/隐私保护
阿里云上快速搭建幻兽帕鲁游戏联机服务器指南
对于热爱幻兽帕鲁游戏的玩家来说,搭建一台专属的联机服务器无疑能够大大提升游戏体验。阿里云作为领先的云计算服务商,为玩家提供了便捷、高效的服务器搭建方案。本文将为您详细介绍如何在阿里云上快速搭建幻兽帕鲁游戏联机服务器,让您轻松享受多人游戏的乐趣。

相关产品

  • 云服务器 ECS