服务器数据恢复—RAID5阵列热备盘未成功激活导致阵列崩溃的数据恢复案例

简介: 服务器数据恢复环境:某品牌X3850服务器中有一组由数块SAS硬盘组建的RAID5阵列,该阵列中有一块盘是热备盘。操作系统为linux redhat,上面跑着一个基于oracle数据库的oa。服务器故障:服务器raid5阵列中有一块硬盘离线,但是热备盘没有成功激活,之后另外一块硬盘离线,RAID崩溃。

服务器数据恢复环境:
某品牌X3850服务器中有一组由数块SAS硬盘组建的RAID5阵列,该阵列中有一块盘是热备盘。操作系统为linux redhat,上面跑着一个基于oracle数据库的oa。

服务器故障:
服务器raid5阵列中有一块硬盘离线,但是热备盘没有成功激活,之后另外一块硬盘离线,RAID崩溃。

服务器数据恢复过程:
1、将故障服务器中所有硬盘标记后取出,硬件工程师检测后没有发现存在硬件故障的硬盘。将所有硬盘以只读方式进行扇区级全盘镜像,镜像过程中发现较后掉线的那块盘上存在少量坏扇区,其余磁盘均没有发现无坏道。
2、基于镜像文件分析所有磁盘底层数据,找到重组raid所需要的相关信息。
1副本.jpg
3、根据上述获取到的raid结构相关信息(RAID级别,条带规则,条带大小,校验方向,META区域等)重组raid,重组完成后进行数据验证,发现200M以上的最新压缩包解压正常,判断该raid结构信息没有问题。
4、按照该结构生成RAID到一块单硬盘上,打开文件系统无明显报错。
5、在确定备份没有问题后,经用户方授权,对原盘重建RAID。重建时已经用全新硬盘更换发现坏道的后掉线的那块盘。
6、将恢复好的单盘接入故障服务器,用linux SystemRescueCd启动故障服务器并通过dd命令进行全盘回写。
7、回写完成后启动操作系统,无法进入操作系统并且报错,报错信息为:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied,怀疑该文件权限有问题。用SystemRescueCd重启后检查,发现此文件时间,权限,大小均有明显错误,显然节点损坏。
8、分析重组数据中的根分区,定位出错的/sbin/pidof,发现问题是由于后掉线硬盘上的坏道导致的。
9、使用其他几块完好的硬盘针对后离线磁盘的损坏区域进行xor补齐。补齐后重新校验文件系统,依然有错误。再次检查inode表,发现这块盘损坏区域有部分节点表现异常。
2副本.jpg

虽然节点中描述的uid还正常存在,但属性、大小、最初的分配块全部错误。按照所有可能性进行分析后,确定无法找回此损坏节点。只能希望能够修复此节点,或复制一个相同的文件过来。
10、针对所有可能有错的文件,北亚企安数据恢复工程师通过日志确定原节点块的节点信息,然后做修正。
11、修正后重新dd根分区,执行fsck -fn /dev/sda5进行检测,依然报错。
3副本.jpg

根据提示检查发现在系统中发现有多个节点共用同样的数据块。按此提示分析底层,发现因为有一块盘很早掉线,所以存在节点信息的新旧交集。
12、按照节点所属的文件进行区别,清除错误节点后,再次执行fsck -fn /dev/sda5,依然有报错信息,但已经很少。根据提示,发现这些节点多位于doc目录下,不影响系统启动,于是执行fsck -fy /dev/sda5强行修复。
13、修复后,重启系统,成功进入桌面。启动数据库服务,启动应用软件,一切正常,无报错。用户方检测后,认可数据恢复结果。

相关文章
|
4月前
|
存储 运维 数据挖掘
服务器数据恢复—EqualLogic存储硬盘出现坏道的数据恢复案例
某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。磁盘阵列上层划分多个大小不同的卷,存放虚拟机文件。 硬盘出现故障导致存储阵列不可用,需要恢复存储阵列中的数据。
|
4月前
|
存储 运维 Oracle
服务器数据恢复—存储硬盘指示灯亮黄灯,RAID5阵列崩溃的数据恢复案例
服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘组建了两组RAID5阵列。一组raid5阵列有27块硬盘,存放Oracle数据库文件。存储系统上层一共划分了11个卷。 服务器存储故障: 存储设备上两个硬盘指示灯亮黄色。其中一组RAID5阵列崩溃,存储不可用,设备已经过保。
|
4月前
|
存储 SQL 关系型数据库
服务器数据恢复—raid崩溃导致同友存储无法启动的数据恢复
某单位同友存储,存储中有一组raid5磁盘阵列。存储内部共有虚拟机若干台,raid5阵列崩溃导致存储无法启动。
|
4月前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
366 10
|
4月前
|
运维 安全 Ubuntu
阿里云渠道商:服务器操作系统怎么选?
阿里云提供丰富操作系统镜像,涵盖Windows与主流Linux发行版。选型需综合技术兼容性、运维成本、安全稳定等因素。推荐Alibaba Cloud Linux、Ubuntu等用于Web与容器场景,Windows Server支撑.NET应用。建议优先选用LTS版本并进行测试验证,通过标准化镜像管理提升部署效率与一致性。
|
4月前
|
弹性计算 ice
阿里云4核8g服务器多少钱一年?1个月和1小时价格,省钱购买方法分享
阿里云4核8G服务器价格因实例类型而异,经济型e实例约159元/月,计算型c9i约371元/月,按小时计费最低0.45元。实际购买享折扣,1年最高可省至1578元,附主流ECS实例及CPU型号参考。
519 8
|
4月前
|
存储 监控 安全
阿里云渠道商:云服务器价格有什么变动?
阿里云带宽与存储费用呈基础资源降价、增值服务差异化趋势。企业应结合业务特点,通过阶梯计价、智能分层、弹性带宽等策略优化成本,借助云监控与预算预警机制,实现高效、可控的云资源管理。
|
4月前
|
弹性计算 运维 安全
区别及选择指南:阿里云轻量应用服务器与ECS云服务器有什么区别?
阿里云轻量应用服务器适合个人开发者、学生搭建博客、测试环境,易用且性价比高;ECS功能更强大,适合企业级应用如大数据、高流量网站。根据需求选择:轻量入门首选,ECS专业之选。
326 2
|
4月前
|
弹性计算 ice
阿里云4核8G云服务器配置价格:热门ECS实例及CPU处理器型号说明
阿里云2025年4核8G服务器配置价格汇总,涵盖经济型e实例、计算型c9i等热门ECS实例,CPU含Intel Xeon及AMD EPYC系列,月费159元起,年付低至1578元,按小时计费0.45元起,实际购买享折扣优惠。
1071 1
|
4月前
|
存储 弹性计算 安全
阿里云渠道商:新手如何选择阿里云ECS实例?
阿里云ECS凭借弹性扩展、稳定可靠与安全防护,助力企业高效上云。本文系统解析实例规格选择关键因素:业务场景匹配、性能评估、成本优化、地域部署与扩展规划,结合计费模式与实际需求,提供科学选型建议,助您精准匹配资源,提升云上效能。(238字)

热门文章

最新文章