【服务器数据恢复】服务器硬盘坏道掉线的数据恢复案例

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 服务器数据恢复环境:一台IBM某型号服务器上有16块FC硬盘组建RAID阵列。上层linux操作系统,ext3文件系统,部署有oracle数据库。服务器故障&检测:服务器上跑的业务突然崩溃,管理员发现服务器上有2块磁盘的指示灯显示黄色。

服务器数据恢复环境:
一台IBM某型号服务器上有16块FC硬盘组建RAID阵列。上层linux操作系统,ext3文件系统,部署有oracle数据库。

服务器故障&检测:
服务器上跑的业务突然崩溃,管理员发现服务器上有2块磁盘的指示灯显示黄色。
通过IBM storage manager查询服务器状态,发现服务器报告逻辑卷状态失败。物理硬盘状态为:一块盘报告“警告”,指示灯显示黄色的2块盘报告“失败”。通过IBM storage manager将当前服务器的日志完整备份。北亚企安数据恢复工程师在备份服务器日志的同时分析日志内容,获取数据恢复所需要的逻辑卷信息。

服务器数据恢复过程:
1、将服务器中所有硬盘编号标记后从服务器内取出,由硬件工程师对所有硬盘进行硬件故障检测,经过检测发现16块盘均可以读取。针对16块盘的SMART状态进行检测,经过检测发现在IBM storage manager中报告“警告”的那块盘的SMART状态也报告为“警告”,结果一致。
2、在windows环境下将识别出来的FC盘在磁盘管理器中标记为脱机状态,然后对这些磁盘进行扇区级别全盘镜像,将原始磁盘中的所有物理扇区镜像到windows系统下的逻辑磁盘并以文件形式保存。在镜像过程中发现SMART状态报告为“警告”的磁盘镜像速度异常,windows环境下的一般应用软件无法对其进行操作,结合前面的检测结果可以判断该盘应该存在损坏/不稳定的扇区。
3、使用专业硬盘镜像设备对这块SMART状态报告为“警告”的磁盘进行镜像,在镜像过程中观察发现该盘的坏道并不多,但是存在大量的读取响应时间长的不稳定扇区,于是调整镜像策略,修改“遇到坏道跳过扇区数”和“响应等待时间”等参数后继续对该盘进行镜像。
4、所有其他磁盘(除了SMART状态报告为“警告”的磁盘)镜像完成后,查看镜像过程中生成的日志,发现在IBM storage manager和硬盘SMART状态中均没报错的另外一块磁盘中也存在坏道,指示灯显示黄色的2块盘也存在大量不规律的坏道分布,根据坏道列表定位到目标镜像文件分析发现,ext3文件系统的一些关键源数据信息已经被坏道破坏,只能等待SMART状态报告为“警告”的磁盘镜像完毕后,通过同一条带进行xor以及根据文件系统上下文关系手动修复被损坏的文件系统。
5、SMART状态报告为“警告”的磁盘镜像完成,但是之前为了最大限度做出有效扇区以及为了保护磁头而设置的拷贝策略会自动跳过一些不稳定扇区,所以该盘的镜像是不完整的。调整拷贝策略,继续镜像被跳过的扇区,直到该盘所有扇区全部镜像出来。
6、将服务器中16块硬盘的物理扇区镜像完成后,在windows平台下使用软件将所有镜像文件全部展开。经过对ext3文件系统的逆向分析以及对日志文件的分析,获取到16块FC盘的盘序,RAID的块大小,RAID的校验走向和方式等信息。
7、利用这些raid相关信息虚拟重组RAID,RAID重构完成后对ext3文件系统进行解析。
8、和用户沟通后,数据恢复工程师提取出了一些oracle的dmp文件,由用户尝试进行恢复。恢复的过程中oracle报告imp-0008错误。北亚企安数据库工程师仔细分析导入dmp文件的日志文件,发现提取出来的dmp文件存在问题。
9、重新分析raid结构,进一步确定ext3文件系统被破坏的程度。又经过数小时的努力,北亚企安数据恢复工程师重新提取了dmp文件和dbf原始库文件。将恢复出来的dmp文件移交给用户进行导入,这次导入一切顺利,没有报错。对恢复出来的dbf原始库文件进行校验,结果所有文件均通过测试。经过仔细核检测后,用户认可数据恢复结果,本次服务器数据恢复工作完成。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2天前
|
存储 SQL 关系型数据库
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
某单位同友存储,存储设备中若干磁盘组建了raid5磁盘阵列。未知原因导致存储设备崩溃无法启动,raid5阵列上层的虚拟机全部丢失,其中存放了重要数据的3台虚拟机需要恢复。
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
|
3天前
|
运维 数据挖掘
服务器数据恢复—RAID5磁盘阵列2块盘离线的数据恢复案例
服务器中有一组由多块硬盘组建的raid5磁盘阵列,服务器阵列中2块硬盘先后掉线导致服务器崩溃。
服务器数据恢复—RAID5磁盘阵列2块盘离线的数据恢复案例
|
6天前
|
存储 关系型数据库 MySQL
服务器数据恢复—ESXi虚拟机无法启动的数据恢复案例
**服务器数据恢复环境:** 某品牌EVA某型号存储中部署VMware ESXi虚拟化平台,数据盘(精简模式)+快照数据盘,虚拟机中有mysql数据库。 **服务器故障:** 机房意外断电导致该存储中的一台VMware虚拟机无法启动,管理员清空cache并尝试重新启动该虚拟机 ,问题依旧,无法成功启动虚拟机。用户方联系到我们数据恢复中心要求恢复该无法启动的虚拟机中的数据。
|
12天前
|
存储 运维 安全
服务器数据恢复—异常断电导致RAID5阵列信息丢失的数据恢复案例
服务器数据恢复环境: 某品牌ProLiant DL380系列服务器,服务器中有一组由6块SAS硬盘组建的RAID5阵列,WINDOWS SERVER操作系统,作为企业内部文件服务器使用。 服务器故障: 机房供电几次意外中断,服务器出现故障前最后一次异常断电重启后RAID报错,提示无法找到存储设备,进入RAID管理模块做任何操作都死机,重启服务器后问题依旧,用户联系北亚企安数据恢复中心寻求帮助。
|
11天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。
118 6
|
13天前
|
域名解析 弹性计算 Linux
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
本文为大家介绍了2024年购买阿里云服务器和注册域名,绑定以及备案的教程,适合需要在阿里云购买云服务器、注册域名并备案的用户参考,新手用户可通过此文您了解在从购买云服务器到完成备案的流程。
阿里云购买云服务器、注册域名、备案及绑定图文教程参考
|
2天前
|
负载均衡 固态存储 Linux
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
轻量应用服务器、云服务器、gpu云服务器是阿里云服务器产品中,比较热门的云服务器产品类型,不同类型的云服务器产品收费模式与收费标准是不一样的,本文为大家展示这几个云服务器产品的最新收费标准情况,以供参考。
阿里云轻量应用服务器、云服务器、gpu云服务器最新收费标准参考
|
2天前
|
弹性计算 负载均衡 容灾
应用阿里云弹性计算:打造高可用性云服务器ECS架构
阿里云弹性计算助力构建高可用云服务器ECS架构,通过实例分布、负载均衡、弹性IP、数据备份及多可用区部署,确保业务连续稳定。自动容错和迁移功能进一步增强容灾能力,提供全方位高可用保障。
10 0
|
2天前
|
存储 弹性计算 监控
探索阿里云弹性计算:如何优化云服务器ECS的性能与成本
在云时代,【阿里云ECS】的性能优化与成本控制至关重要。利用实例规格选择、自动伸缩、网络和存储配置,可增强性能、减少成本。结合监控工具和优化建议,用户能解决性能问题,提升应用稳定性,实现高效且经济的云计算运营。
9 1
|
2天前
|
弹性计算 运维 监控
解密阿里云弹性计算:探索云服务器ECS的核心功能
阿里云ECS是核心计算服务,提供弹性云服务器资源,支持实例按需配置、集群管理和监控,集成安全防护,确保服务稳定、安全,助力高效业务运营。
12 0

相关产品

  • 云服务器 ECS