服务器数据恢复—某品牌P2000服务器raid5阵列数据恢复案例

本文涉及的产品
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,1个月黄金款+200核时
资源编排,不限时长
简介: 服务器数据恢复环境:某品牌P2000服务器,有一组由数块硬盘组建的raid5磁盘阵列(有热备盘),部署了VMWARE ESX虚拟化平台,VMFS文件系统。服务器故障:服务器在正常运行中,raid5阵列有两块硬盘亮黄色故障灯。经用户方工作人员初步检测,亮黄色故障灯的硬盘出现物理故障,故障表现为:序列号无法读取,通过SAS扩展卡无法识别硬盘。

服务器数据恢复环境:
某品牌P2000服务器,有一组由数块硬盘组建的raid5磁盘阵列(有热备盘),部署了VMWARE ESX虚拟化平台,VMFS文件系统。

服务器故障:

服务器在正常运行中,raid5阵列有两块硬盘亮黄色故障灯。经用户方工作人员初步检测,亮黄色故障灯的硬盘出现物理故障,故障表现为:序列号无法读取,通过SAS扩展卡无法识别硬盘。

服务器数据恢复过程:
1、将故障服务器上所有磁盘编号后取出,然后由硬件工程师将那2块故障盘连接到SAS扩展卡上加电检测,结果磁头不寻道。硬件工程师将PCB分离,检查硬盘HDA组件发现氧化的情况。清洁后再次加电依然无法寻道。于是硬件工程师在北亚企安的无尘工作室对故障硬盘进行开盘操作。
硬件工程师将检测完好的备件盘开盘,拆取PCB替换掉故障盘的PCB,再将故障盘PCB上的ROM芯片拆掉替换到新的PCB上。再次将修复完成的故障硬盘加电检测,这回可以正常起转,磁头寻道声音正常,但是发出明显的敲盘声。由于热备盘的磁头与故障盘不匹配,于是另找同型号的磁头替换故障盘的磁头,这次硬盘可以正常识别。
将修复好的故障盘和其他完好的硬盘以只读方式做全盘镜像。镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、使用工具打开所有磁盘的镜像文件,发现所有硬盘的0扇区都有“55 AA”标志。0x01C2H处表示该分区的类型,0x01C2H处显示“05”意味着这是一个扩展分区。因此从0扇区看这是MBR分区结构异常。
继续查找,分别在另外2块磁盘(暂时称为a盘和b盘)找到了“55 AA”的标志。其中a盘的查询结果表示这是一个正常的MBR分区,其0x01C6处数值意味着指向的下一个扇区为GPT的头部。
1.jpg

查看b盘的0x01C6处数值,但是下一个扇区明显不是GPT的头部。
2.jpg

由此可以初步判断a盘是第一块盘,b是最后一块盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。
3、对故障服务器raid5阵列进行分析,发现raid条带大小为1024个扇区。按照1024扇区进行分割,使一个记录为一个条带的大小,所有盘跳到同一记录283123。
3.jpg

当所有盘都定位到同一位置时,通过对比可以判断校验区的走向,从而判断整个RAID5的走向。将判断出是第一块盘的a盘放在第一个位置,确定RAID5的走向和盘序。
4.jpg

4、跳到172032扇区对硬盘的使用情况进行观察,正常情况下这个扇区所属条带中的那块盘应该是校验区,但实际情况中却显示校验区为a盘。根据该raid左走向规律,172032扇区所属条带中的那块盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为172032扇区所属条带中的那块盘。因此可以确定LUN的起始扇区为171008扇区。
按照确定的盘序重组raid。
5.jpg

点击Build进行重组。组好raid后,由于数据从1024*8=8192个扇区开始,若工具没有跳转到此扇区的功能,那么刚组好的RAID必须和一个文件再进行一次Build重组操作。
重组后的raid5磁盘阵列:
6.jpg

5、RAID5磁盘阵列重建完成后由用户方进行验证,经过验证用户方确认数据完整有效。本次数据恢复工作完成。

相关文章
|
3天前
|
存储 数据挖掘 数据库
服务器数据恢复—OceanStor存储数据恢复案例
华为OceanStor T系列某型号存储中有一组由24块机械硬盘组建的一组RAID5阵列。 运行过程中该存储设备RAID5阵列上多块硬盘出现故障离线,阵列失效,存储中数据无法访问。
|
1天前
|
存储 数据挖掘
服务器数据恢复—zfs文件系统服务器数据恢复案例
一台配有32块硬盘的服务器在运行过程中突然崩溃不可用。经过初步检测,基本上确定服务器硬件不存在物理故障。管理员重启服务器后问题依旧。需要恢复该服务器中的数据。
|
9天前
|
运维 数据挖掘 索引
服务器数据恢复—Lustre分布式文件系统服务器数据恢复案例
5台节点服务器,每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘(其中1块硬盘设置为热备盘,其他5块硬盘为数据盘)。上层系统环境为Lustre分布式文件系统。 机房天花板漏水导致这5台节点服务器进水,每台服务器都有至少2块硬盘出现故障。每台服务器中的RAID5阵列短时间内同时掉线2块或以上数量的硬盘,导致RAID崩溃,服务器中数据无法正常读取。
|
3天前
|
机器学习/深度学习 人工智能 PyTorch
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
|
2天前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。
|
9天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
9天前
|
开发框架 缓存 .NET
阿里云轻量应用服务器、经济型e、通用算力型u1实例怎么选?区别及选择参考
在阿里云目前的活动中,价格比较优惠的云服务器有轻量应用服务器2核2G3M带宽68元1年,经济型e实例2核2G3M带宽99元1年,通用算力型u1实例2核4G5M带宽199元1年,这几个云服务器是用户关注度最高的。有的新手用户由于是初次使用阿里云服务器,对于轻量应用服务器、经济型e、通用算力型u1实例的相关性能并不是很清楚,本文为大家做个简单的介绍和对比,以供参考。
|
17天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
18天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
20天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)

相关产品

  • 云服务器 ECS