服务器数据恢复—拯救raid5阵列数据大行动,raid5数据恢复案例分享

本文涉及的产品
无影云电脑个人版,1个月黄金款+200核时
资源编排,不限时长
无影云电脑企业版,4核8GB 120小时 1个月
简介: **Raid5数据恢复算法原理:**分布式奇偶校验的独立磁盘结构(被称之为raid5)的数据恢复有一个“奇偶校验”的概念。可以简单的理解为二进制运算中的“异或运算”,通常使用的标识是xor。运算规则:若二者值相同则结果为0,若二者结果不同则结果为1。例如0101 xor 0010根据上述运算规则来计算的话二者第一位都是0,两者相同,结果为0 ;第二、三、四位的数值不同则结果均为1,所以最终结果为0111。公式表示为:0101 xor 0010 = 0111,所以在 a xor b=c 中如果缺少其中之一,我们可以通过其他数据进行推算,这就是raid5数据恢复的基本原理。了解了这个基本原理

Raid5数据恢复算法原理:
分布式奇偶校验的独立磁盘结构(被称之为raid5)的数据恢复有一个“奇偶校验”的概念。可以简单的理解为二进制运算中的“异或运算”,通常使用的标识是xor。运算规则:若二者值相同则结果为0,若二者结果不同则结果为1。
例如0101 xor 0010根据上述运算规则来计算的话二者第一位都是0,两者相同,结果为0 ;第二、三、四位的数值不同则结果均为1,所以最终结果为0111。公式表示为:0101 xor 0010 = 0111,所以在 a xor b=c 中如果缺少其中之一,我们可以通过其他数据进行推算,这就是raid5数据恢复的基本原理。
了解了这个基本原理之后,您可以尝试一下恢复raid5阵列的丢失数据。

Raid5磁盘阵列数据恢复案例一:
一台某品牌服务器中有一组由6块SCSI硬盘组建的raid5磁盘阵列,redhat linux操作系统+ext3文件系统。
在运行过程中服务器瘫痪,管理员对服务器进行检查后发现有两块硬盘离线,将其中一块离线硬盘进行强制上线操作,但操作系统无法正常启动。于是管理员将服务器关机,然后联系北亚企安数据恢复中心恢复服务器中的数据。
在服务器数据恢复工作中,raid5阵列两块硬盘离线的情况十分常见。raid5支持一块硬盘离线的冗余保护,一旦多块硬盘离线,服务器便处于瘫痪状态,且离线硬盘不会自动上线。大多数品牌的raid控制器对阵列中磁盘状态比较敏感,多数情况下硬盘掉线仅仅是因为电源波动、控制器bug、磁盘读写不稳定等非磁盘故障原因所导致,所以很多情况下磁盘阵列中的掉线盘不存在物理故障,本案例就是如此。这种情况下将掉线硬盘强制上线的风险是很大的,一旦上线出错就会给数据造成不可逆的损坏,数据恢复难度非常大。
将故障服务器中所有硬盘变厚取出,以只读方式进行扇区级全盘镜像,在镜像备份过程中发现多块硬盘存在坏道但没有下线,可能是raid没有读到硬盘坏道。镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
基于镜像文件分析原服务器的raid组成结构,虚拟重组raid并对raid结构进行验证,人工修复破坏的结构,将修正后的数据导出到一台存储上临时存放。
使用完好的硬盘在原服务器上搭建新的raid5磁盘阵列,将恢复出的数据迁移到新搭建的raid中。检验恢复出来的数据,一切正常。
Tips:一旦raid5磁盘阵列出现多块硬盘离线,并且服务器瘫痪的情况切记不要盲目进行强制上线操作。如果有足够的备用空间,可将源硬盘全部镜像。

Raid5磁盘阵列数据恢复案例二:
一台服务器中有一组由12块磁盘组建的raid5磁盘阵列,Linux操作系统+ext3文件系统。Raid中2号盘和6号盘两块硬盘的指示灯亮黄色,工作人员检查后将6号盘进行强制上线操作,强制上线后发现有很多目录打不开,少数可以打开的目录中的部分目录有文件丢失的情况。管理员联系北亚企安数据恢复中心恢复服务器中的数据。
镜像过程在这里不再赘述了。首先基于镜像文件分析原raid结构,将强制上线的6号盘去掉,将2号盘加入进去并虚拟重组raid。
提取数据,在2号盘中发现不规则的坏道。
使用专业工具将2号硬盘进行完整镜像,绝大部分坏道成功读取。
将2号盘镜像数据加入并虚拟重组raid环境,再次提取数据,经过检测,99%的数据都被恢复出来,用户认可数据恢复结果。

相关文章
|
1天前
|
运维 数据挖掘 索引
服务器数据恢复—Lustre分布式文件系统服务器数据恢复案例
5台节点服务器,每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘(其中1块硬盘设置为热备盘,其他5块硬盘为数据盘)。上层系统环境为Lustre分布式文件系统。 机房天花板漏水导致这5台节点服务器进水,每台服务器都有至少2块硬盘出现故障。每台服务器中的RAID5阵列短时间内同时掉线2块或以上数量的硬盘,导致RAID崩溃,服务器中数据无法正常读取。
|
6天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
15天前
|
安全 数据挖掘
服务器数据恢复—RAID5阵列中两块硬盘离线导致阵列崩溃的数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中一块硬盘未知原因离线,热备盘自动激活上线替换离线硬盘。在热备盘上线过程中,raid5阵列中又有一块硬盘离线。热备盘同步失败,该raid阵列崩溃,LVM结构变得不完整,文件系统无法正常使用。
|
7天前
|
存储 数据挖掘
服务器数据恢复—ZFS文件系统下数据恢复案例
服务器存储数据恢复环境: ZFS Storage 7320存储阵列中有32块硬盘。32块硬盘分为4组,每组8块硬盘,共组建了3组RAIDZ,每组raid都配置了热备盘。 服务器存储故障: 服务器存储运行过程中突然崩溃,排除人为误操作、断电、进水和其他机房不稳定因素。管理员重启服务器存储,系统无法进入,需要恢复服务器存储中的数据。
|
20天前
|
存储 Oracle 安全
服务器数据恢复—LINUX系统删除/格式化的数据恢复流程
Linux操作系统是世界上流行的操作系统之一,被广泛用于服务器、个人电脑、移动设备和嵌入式系统。Linux系统下数据被误删除或者误格式化的问题非常普遍。下面北亚企安数据恢复工程师简单聊一下基于linux的文件系统(EXT2/EXT3/EXT4/Reiserfs/Xfs) 下删除或者格式化的数据恢复流程和可行性。
|
2天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
1天前
|
开发框架 缓存 .NET
阿里云轻量应用服务器、经济型e、通用算力型u1实例怎么选?区别及选择参考
在阿里云目前的活动中,价格比较优惠的云服务器有轻量应用服务器2核2G3M带宽68元1年,经济型e实例2核2G3M带宽99元1年,通用算力型u1实例2核4G5M带宽199元1年,这几个云服务器是用户关注度最高的。有的新手用户由于是初次使用阿里云服务器,对于轻量应用服务器、经济型e、通用算力型u1实例的相关性能并不是很清楚,本文为大家做个简单的介绍和对比,以供参考。
|
9天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
10天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
13天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)

相关产品

  • 云服务器 ECS