服务器数据恢复—光纤存储映射的卷挂载不上的数据恢复案例

本文涉及的产品
资源编排,不限时长
无影云电脑个人版,1个月黄金款+200核时
无影云电脑企业版,4核8GB 120小时 1个月
简介: 服务器存储数据恢复环境:某品牌光纤存储上共有16块FC硬盘。存储上的卷映射到Linux操作系统上。Linux操作系统上运行Oracle数据库。服务器存储故障&检测:存储上2块硬盘故障灯亮起,存储映射到linux操作系统上的卷挂载不上,业务中断。

服务器存储数据恢复环境:
某品牌光纤存储上共有16块FC硬盘。存储上的卷映射到Linux操作系统上。Linux操作系统上运行Oracle数据库。

服务器存储故障&检测:
存储上2块硬盘故障灯亮起,存储映射到linux操作系统上的卷挂载不上,业务中断。
使用storage manager连接到存储查看存储目前状态,发现逻辑卷状态失败;6号盘报告“警告”,10号盘和13号盘报告“失败”;通过storage manager将当前存储的完整日志状态备份下来,解析备份的日志获取关于逻辑卷结构的部分信息。
将16块FC盘标记后从存储中取出,使用专业设备检测后发现16块盘均能正常识别,6号盘的SMART状态为“警告”,和在storage manager中的报告结果一致。
将所有磁盘以只读方式进行扇区级全盘镜像。在镜像过程中观察镜像的速度和稳定性,发现6号盘的镜像速度异常,结合之前检测结果,基本上可以判断6号盘应该存在损坏或者不稳定扇区。经过观察发现6号盘的坏道并不多,但是存在大量的读取响应时间长的不稳定扇区。调整镜像策略继续对6号盘做镜像。
所有磁盘镜像完成后,查看日志,发现在storage manager和硬盘SMART状态检测中均没有发现问题的1号盘也存在坏道,10号和13号盘均存在大量不规律的坏道。根据坏道列表定位到目标镜像文件,分析后发现ext3文件系统的部分关键源数据信息已经被坏道破坏。只能等所有磁盘镜像完毕后,
通过同一条带进行xor以及根据文件系统上下文关系手动修复被损坏的文件系统。
虽然通过调整镜像策略完成6号盘的镜像,但是调整后的镜像策略会自动跳过一些不稳定扇区,所以做出来的镜像是不完整的。再次调整镜像策略,继续镜像被跳过的扇区,直到全部镜像完成。
基于镜像文件分析所有磁盘底层数据。通过对ext3文件系统的逆向分析以及对日志文件的分析,获取到16块FC盘在存储中的盘序、RAID的块大小、RAID的校验走向和方式等重组RAID所需要的信息。尝试使用上述获取到的信息重组RAID,重组完成后解析ext3文件系统。和用户沟通后,提取出一些oracle的dmp文件,用户尝试使用这些dmp文件恢复Oracle数据库数据。
在使用dmp文件恢复Oracle数据库的过程中,数据库报告imp-0008错误。对导入dmp文件的日志文件进行分析,发现恢复出来的dmp文件存在问题。重新分析raid结构,进一步确定ext3文件系统被破坏的程度,重新恢复dmp文件和dbf原始库文件。将恢复出来的dmp文件进行导入测试,这次没有发现问题。对恢复出来的dbf原始库文件进行校验检测,所有文件均能通过检测。

Oracle数据库恢复过程:
1、拷贝数据库文件到原数据库服务器,目标路径为/home/oracle/tmp/syntong。
在根目录下创建一个oradata文件夹,将备份的syntong文件夹拷贝到oradata目录下。更改oradata文件夹及其所有文件的属组和权限。
2、备份原数据库环境,包括ORACLE_HOME下product文件夹下的相关文件。配置监听,使用原机中的splplus连接到数据库。尝试启动数据库到nomount状态,查询基本状态,确认环境和参数文件均没有问题。 尝试启动数据库到mount状态,查询状态没有问题。启动数据库到open状态时报错。
1副本.jpg

3、进一步检测和分析后基本上可以判断此故障发生原因是控制文件和数据文件信息不一致,这一类问题通常是因为断电或异常关机导致的。
4、逐个检测数据库文件,没有发现有文件存在物理损坏。
5、在mount状态下备份控制文件:alter database backup controlfile to trace as ' /backup/controlfile'。查看&修改备份的控制文件,获取重建控制文件命令。将这些命令复制到一个新建脚本文件controlfile.sql中。
6、关闭数据库,删除/oradata/syntong/下的3个控制文件。 启动数据库到nomount状态,执行controlfile.sql 脚本。
2副本.jpg

7、完成控制文件的重建后,启动数据库。仍然报错,需要进一步处理。
3副本.jpg

执行恢复命令:
4副本.jpg

做介质恢复,直到返回报告。
8、尝试open数据库。
SQL> alter database open resetlogs;
9、数据库启动成功。把原temp表空间的数据文件加入到对应的temp表空间中。
10、对数据库进行各种常规检查,没有发现任何问题
11、进行emp备份。全库备份完成,没有报错。将应用程序连接到数据库验证数据。
12、经过仔细验证,用户方确认数据库数据没有问题,认可数据恢复结果。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2天前
|
存储 数据挖掘 数据库
服务器数据恢复—OceanStor存储数据恢复案例
华为OceanStor T系列某型号存储中有一组由24块机械硬盘组建的一组RAID5阵列。 运行过程中该存储设备RAID5阵列上多块硬盘出现故障离线,阵列失效,存储中数据无法访问。
|
8天前
|
运维 数据挖掘 索引
服务器数据恢复—Lustre分布式文件系统服务器数据恢复案例
5台节点服务器,每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘(其中1块硬盘设置为热备盘,其他5块硬盘为数据盘)。上层系统环境为Lustre分布式文件系统。 机房天花板漏水导致这5台节点服务器进水,每台服务器都有至少2块硬盘出现故障。每台服务器中的RAID5阵列短时间内同时掉线2块或以上数量的硬盘,导致RAID崩溃,服务器中数据无法正常读取。
|
13天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
2天前
|
机器学习/深度学习 人工智能 PyTorch
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
|
1天前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。
|
9天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
8天前
|
开发框架 缓存 .NET
阿里云轻量应用服务器、经济型e、通用算力型u1实例怎么选?区别及选择参考
在阿里云目前的活动中,价格比较优惠的云服务器有轻量应用服务器2核2G3M带宽68元1年,经济型e实例2核2G3M带宽99元1年,通用算力型u1实例2核4G5M带宽199元1年,这几个云服务器是用户关注度最高的。有的新手用户由于是初次使用阿里云服务器,对于轻量应用服务器、经济型e、通用算力型u1实例的相关性能并不是很清楚,本文为大家做个简单的介绍和对比,以供参考。
|
16天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
17天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
20天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)

相关产品

  • 云服务器 ECS