服务器数据恢复—RAID5阵列热备盘未成功激活导致阵列崩溃的数据恢复案例

简介: 服务器数据恢复环境:某品牌X3850服务器中有一组由数块SAS硬盘组建的RAID5阵列,该阵列中有一块盘是热备盘。操作系统为linux redhat,上面跑着一个基于oracle数据库的oa。服务器故障:服务器raid5阵列中有一块硬盘离线,但是热备盘没有成功激活,之后另外一块硬盘离线,RAID崩溃。

服务器数据恢复环境:
某品牌X3850服务器中有一组由数块SAS硬盘组建的RAID5阵列,该阵列中有一块盘是热备盘。操作系统为linux redhat,上面跑着一个基于oracle数据库的oa。

服务器故障:
服务器raid5阵列中有一块硬盘离线,但是热备盘没有成功激活,之后另外一块硬盘离线,RAID崩溃。

服务器数据恢复过程:
1、将故障服务器中所有硬盘标记后取出,硬件工程师检测后没有发现存在硬件故障的硬盘。将所有硬盘以只读方式进行扇区级全盘镜像,镜像过程中发现较后掉线的那块盘上存在少量坏扇区,其余磁盘均没有发现无坏道。
2、基于镜像文件分析所有磁盘底层数据,找到重组raid所需要的相关信息。
1副本.jpg
3、根据上述获取到的raid结构相关信息(RAID级别,条带规则,条带大小,校验方向,META区域等)重组raid,重组完成后进行数据验证,发现200M以上的最新压缩包解压正常,判断该raid结构信息没有问题。
4、按照该结构生成RAID到一块单硬盘上,打开文件系统无明显报错。
5、在确定备份没有问题后,经用户方授权,对原盘重建RAID。重建时已经用全新硬盘更换发现坏道的后掉线的那块盘。
6、将恢复好的单盘接入故障服务器,用linux SystemRescueCd启动故障服务器并通过dd命令进行全盘回写。
7、回写完成后启动操作系统,无法进入操作系统并且报错,报错信息为:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied,怀疑该文件权限有问题。用SystemRescueCd重启后检查,发现此文件时间,权限,大小均有明显错误,显然节点损坏。
8、分析重组数据中的根分区,定位出错的/sbin/pidof,发现问题是由于后掉线硬盘上的坏道导致的。
9、使用其他几块完好的硬盘针对后离线磁盘的损坏区域进行xor补齐。补齐后重新校验文件系统,依然有错误。再次检查inode表,发现这块盘损坏区域有部分节点表现异常。
2副本.jpg

虽然节点中描述的uid还正常存在,但属性、大小、最初的分配块全部错误。按照所有可能性进行分析后,确定无法找回此损坏节点。只能希望能够修复此节点,或复制一个相同的文件过来。
10、针对所有可能有错的文件,北亚企安数据恢复工程师通过日志确定原节点块的节点信息,然后做修正。
11、修正后重新dd根分区,执行fsck -fn /dev/sda5进行检测,依然报错。
3副本.jpg

根据提示检查发现在系统中发现有多个节点共用同样的数据块。按此提示分析底层,发现因为有一块盘很早掉线,所以存在节点信息的新旧交集。
12、按照节点所属的文件进行区别,清除错误节点后,再次执行fsck -fn /dev/sda5,依然有报错信息,但已经很少。根据提示,发现这些节点多位于doc目录下,不影响系统启动,于是执行fsck -fy /dev/sda5强行修复。
13、修复后,重启系统,成功进入桌面。启动数据库服务,启动应用软件,一切正常,无报错。用户方检测后,认可数据恢复结果。

相关文章
|
1月前
|
存储
服务器数据恢复—EMC存储RAID5阵列崩溃的数据恢复案例
服务器数据恢复环境: 一台EMC某型号存储设备,该存储中有一组由12块(包括2块热备盘)STAT硬盘组建的raid5阵列。 服务器故障: 该存储在运行过程中突然崩溃,raid瘫痪。数据恢复工程师到达现场对故障存储设备进行初检,发现raid中有两块硬盘掉线但只有一块热备盘成功激活,所以导致阵列瘫痪,上层lun无法使用。
|
2月前
|
运维 数据挖掘 开发工具
服务器数据恢复—硬盘离线导致raid5阵列热备盘上线失败的数据恢复案例
服务器磁盘阵列数据恢复环境: 服务器中有两组分别由4块SAS硬盘组建的raid5磁盘阵列,两组raid5阵列划分LUN,组成LVM结构,格式化为EXT3文件系统。 服务器磁盘阵列故障: 服务器中一组raid5阵列中有一块硬盘离线,热备盘自动上线替换离线硬盘。热备盘上线同步数据过程中又有一块硬盘离线,热备盘同步失败,该组raid5阵列崩溃,LVM结构变得不完整,文件系统无法使用。 硬件工程师对两块离线硬盘进行硬件故障检测,发现先离线硬盘无法识别,初步判断该硬盘存在硬件故障,需要进行开盘修复。后离线硬盘可以正常识别。
服务器数据恢复—硬盘离线导致raid5阵列热备盘上线失败的数据恢复案例
|
6月前
|
存储 安全 数据挖掘
服务器数据恢复—正常断电后重启的服务器中Raid5阵列崩溃的数据恢复案例
服务器数据恢复环境: 一台某品牌DL380 G4服务器,服务器通过该服务器品牌smart array控制器挂载了一台国产的磁盘阵列,磁盘阵列中有一组由14块SCSI硬盘组建的RAID5。服务器安装LINUX操作系统,搭建了NFS+FTP,作为内部文件服务器使用。 服务器故障: 搬迁机房后,工作人员将服务器和磁盘阵列打扫了一下,连接所有线缆后,将服务器和磁盘阵列开机,发现服务器无法识别RAID,提示未做初始化。 北亚企安数据恢复工程师到达现场后对服务器和磁盘阵列进行简单的初检,经过初检发现数据丢失的原因是raid信息丢失,该RAID的冗余采用双循环的校验方式。
|
3月前
|
Oracle 关系型数据库 数据挖掘
服务器数据恢复—硬盘坏道导致raid5阵列崩溃的数据恢复案例
一台ibm x3850服务器,有一组由5块硬盘组建的raid5磁盘阵列,上层是Redhat Linux操作系统,部署了一个oracle数据库。 raid5阵列中2块硬盘离线,阵列崩溃。经过检测发现该raid中的热备盘未激活,硬盘无物理故障,无明显同步表现。
服务器数据恢复—硬盘坏道导致raid5阵列崩溃的数据恢复案例
|
3月前
|
数据挖掘
服务器数据恢复—Raid5阵列热备盘上线失败的数据恢复案例
两组分别由4块SAS硬盘组建的raid5磁盘阵列,ext3文件系统+lvm结构。 磁盘阵列中一块硬盘离线,热备盘自动上线替换离线硬盘并开始同步数据。在热备盘同步数据的过程中该组raid中另外一块硬盘出现故障掉线,该组Raid崩溃,LVM结构不完整,文件系统不可用,服务器瘫痪。 管理员检查掉线的两块硬盘,前面掉线的硬盘无法识别,后掉线的硬盘可以识别。
服务器数据恢复—Raid5阵列热备盘上线失败的数据恢复案例
|
2月前
|
存储 运维 小程序
服务器数据恢复—双循环RAID5阵列数据恢复案例
服务器存储数据恢复环境: 一台存储中有一组由7块硬盘组建的RAID5阵列,存储中还有另外3块盘是raid中掉线的硬盘(硬盘掉线了,管理员只是添加一块的新的硬盘做rebuild,并没有将掉线的硬盘拔掉)。整个RAID5阵列的存储空间划分了一个LUN。 服务器存储故障: 硬盘出现故障导致存储中阵列瘫痪。 和管理员沟通,据管理员说是磁盘阵列中某些硬盘出现故障导致存储不可用,初步判断RAID中有硬盘掉线了。
|
3月前
|
存储 运维 数据挖掘
服务器数据恢复—raid5阵列2块硬盘离线,热备盘未全部启用的数据恢复案例
服务器存储数据恢复环境: 一台EMC某型号存储中有一组RAID5磁盘阵列。该raid5阵列中有12块硬盘,其中2块硬盘为热备盘。 服务器存储故障: 该存储raid5阵列中有两块硬盘离线,只有1块热备盘启用替换掉其中一块离线盘,另外1块热备盘未成功启用,raid5阵列崩溃,存储不可用。 磁盘阵列中硬盘离线的原因通常是磁盘存在物理故障或者硬盘出现坏道。由于EMC存储中的raid控制器的磁盘检查策略十分严格,经常将硬盘的性能不稳定判定为硬件故障并将该硬盘踢出raid。很多情况下EMC存储中raid崩溃的原因就是磁盘读写不稳定。
服务器数据恢复—raid5阵列2块硬盘离线,热备盘未全部启用的数据恢复案例
|
3月前
|
SQL 数据库 数据安全/隐私保护
服务器数据恢复—raid5阵列故障因操作不当导致数据无法恢复的案例
服务器数据恢复环境: 一台服务器中有一组由4块SCSI硬盘组建的raid5磁盘阵列,划分了一个逻辑卷,操作系统为WINDOWS SERVER,作为SQL SERVER服务器使用。 服务器故障: 运行过程中该服务器raid5磁盘阵列瘫痪,管理员检查服务器发现raid5阵列中已经有3块磁盘离线。管理员选择其中2块离线硬盘进行强制上线操作,强制上线后操作系统无法启动。使用WINPE光盘启动操作系统后,可以看到数据。
|
4月前
|
数据挖掘
服务器数据恢复—RAID5阵列重建导致原raid数据丢失的数据恢复案例
一台服务器,有一组由5块硬盘组建的raid5磁盘阵列。 服务器在运行过程中一块有磁盘掉线,由于raid5阵列支持一块磁盘掉线的特性,服务器还在正常工作。不久之后服务器出现故障,管理员在不了解raid配置情况下,以原raid5阵列中的4块盘作为成员盘重建了raid5阵列。结果原raid5阵列中的全部数据丢失。
|
5月前
|
Oracle 关系型数据库 数据挖掘
服务器数据恢复—raid5阵列两块盘离线导致服务器数据丢失的数据恢复案例
服务器数据恢复环境: 某品牌x3850 X5服务器,服务器上有一组由5块硬盘组建的raid5阵列(包含一块热备盘),安装linux操作系统,运行oracle数据库。 服务器故障: 服务器上raid5阵列中两块硬盘由于未知故障离线,服务器数据丢失。北亚企安数据恢复中心安排服务器数据恢复工程师达到现场对故障服务器进行初检,发现raid5阵列中有两块硬盘处于离线状态;热备盘未激活,经过检测没有发现物理故障,无明显同步表现。
服务器数据恢复—raid5阵列两块盘离线导致服务器数据丢失的数据恢复案例

相关实验场景

更多