服务器数据恢复—光纤存储映射的卷挂载不上的数据恢复案例

本文涉及的产品
资源编排,不限时长
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,1个月黄金款+200核时
简介: 服务器存储数据恢复环境:某品牌光纤存储上共有16块FC硬盘。存储上的卷映射到Linux操作系统上。Linux操作系统上运行Oracle数据库。服务器存储故障&检测:存储上2块硬盘故障灯亮起,存储映射到linux操作系统上的卷挂载不上,业务中断。

服务器存储数据恢复环境:
某品牌光纤存储上共有16块FC硬盘。存储上的卷映射到Linux操作系统上。Linux操作系统上运行Oracle数据库。

服务器存储故障&检测:
存储上2块硬盘故障灯亮起,存储映射到linux操作系统上的卷挂载不上,业务中断。
使用storage manager连接到存储查看存储目前状态,发现逻辑卷状态失败;6号盘报告“警告”,10号盘和13号盘报告“失败”;通过storage manager将当前存储的完整日志状态备份下来,解析备份的日志获取关于逻辑卷结构的部分信息。
将16块FC盘标记后从存储中取出,使用专业设备检测后发现16块盘均能正常识别,6号盘的SMART状态为“警告”,和在storage manager中的报告结果一致。
将所有磁盘以只读方式进行扇区级全盘镜像。在镜像过程中观察镜像的速度和稳定性,发现6号盘的镜像速度异常,结合之前检测结果,基本上可以判断6号盘应该存在损坏或者不稳定扇区。经过观察发现6号盘的坏道并不多,但是存在大量的读取响应时间长的不稳定扇区。调整镜像策略继续对6号盘做镜像。
所有磁盘镜像完成后,查看日志,发现在storage manager和硬盘SMART状态检测中均没有发现问题的1号盘也存在坏道,10号和13号盘均存在大量不规律的坏道。根据坏道列表定位到目标镜像文件,分析后发现ext3文件系统的部分关键源数据信息已经被坏道破坏。只能等所有磁盘镜像完毕后,
通过同一条带进行xor以及根据文件系统上下文关系手动修复被损坏的文件系统。
虽然通过调整镜像策略完成6号盘的镜像,但是调整后的镜像策略会自动跳过一些不稳定扇区,所以做出来的镜像是不完整的。再次调整镜像策略,继续镜像被跳过的扇区,直到全部镜像完成。
基于镜像文件分析所有磁盘底层数据。通过对ext3文件系统的逆向分析以及对日志文件的分析,获取到16块FC盘在存储中的盘序、RAID的块大小、RAID的校验走向和方式等重组RAID所需要的信息。尝试使用上述获取到的信息重组RAID,重组完成后解析ext3文件系统。和用户沟通后,提取出一些oracle的dmp文件,用户尝试使用这些dmp文件恢复Oracle数据库数据。
在使用dmp文件恢复Oracle数据库的过程中,数据库报告imp-0008错误。对导入dmp文件的日志文件进行分析,发现恢复出来的dmp文件存在问题。重新分析raid结构,进一步确定ext3文件系统被破坏的程度,重新恢复dmp文件和dbf原始库文件。将恢复出来的dmp文件进行导入测试,这次没有发现问题。对恢复出来的dbf原始库文件进行校验检测,所有文件均能通过检测。

Oracle数据库恢复过程:
1、拷贝数据库文件到原数据库服务器,目标路径为/home/oracle/tmp/syntong。
在根目录下创建一个oradata文件夹,将备份的syntong文件夹拷贝到oradata目录下。更改oradata文件夹及其所有文件的属组和权限。
2、备份原数据库环境,包括ORACLE_HOME下product文件夹下的相关文件。配置监听,使用原机中的splplus连接到数据库。尝试启动数据库到nomount状态,查询基本状态,确认环境和参数文件均没有问题。 尝试启动数据库到mount状态,查询状态没有问题。启动数据库到open状态时报错。
1副本.jpg

3、进一步检测和分析后基本上可以判断此故障发生原因是控制文件和数据文件信息不一致,这一类问题通常是因为断电或异常关机导致的。
4、逐个检测数据库文件,没有发现有文件存在物理损坏。
5、在mount状态下备份控制文件:alter database backup controlfile to trace as ' /backup/controlfile'。查看&修改备份的控制文件,获取重建控制文件命令。将这些命令复制到一个新建脚本文件controlfile.sql中。
6、关闭数据库,删除/oradata/syntong/下的3个控制文件。 启动数据库到nomount状态,执行controlfile.sql 脚本。
2副本.jpg

7、完成控制文件的重建后,启动数据库。仍然报错,需要进一步处理。
3副本.jpg

执行恢复命令:
4副本.jpg

做介质恢复,直到返回报告。
8、尝试open数据库。
SQL> alter database open resetlogs;
9、数据库启动成功。把原temp表空间的数据文件加入到对应的temp表空间中。
10、对数据库进行各种常规检查,没有发现任何问题
11、进行emp备份。全库备份完成,没有报错。将应用程序连接到数据库验证数据。
12、经过仔细验证,用户方确认数据库数据没有问题,认可数据恢复结果。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
1月前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
6月前
|
存储 SQL 关系型数据库
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
某单位同友存储,存储设备中若干磁盘组建了raid5磁盘阵列。未知原因导致存储设备崩溃无法启动,raid5阵列上层的虚拟机全部丢失,其中存放了重要数据的3台虚拟机需要恢复。
服务器数据恢复—同友存储中raid5阵列上层虚拟机数据恢复案例
|
存储 运维 Oracle
服务器数据恢复-DS5300存储硬盘出现坏道离线的数据恢复案例
服务器数据恢复环境: 某单位一台DS5300存储,1个主机+4个扩展柜,组建了2组RAID5(一组27块硬盘,一组23块盘)。27块盘的那组RAID5阵列存放Oracle数据库文件,存储系统一共分了11个卷。 服务器故障: 27块盘的那组RAID5阵列中有2块磁盘故障离线,导致RAID阵列崩溃,存储不可用,存储设备已经过保。
服务器数据恢复-DS5300存储硬盘出现坏道离线的数据恢复案例
|
4月前
|
存储 Unix 数据挖掘
服务器数据恢复—DS4800存储lvm信息丢失数据恢复案例
DS4800服务器存储lvm信息丢失,基于DS4800的aix小机卷丢失。
服务器数据恢复—DS4800存储lvm信息丢失数据恢复案例
|
9天前
|
存储 Oracle 关系型数据库
服务器数据恢复—DS5300存储raid5阵列数据恢复案例
服务器存储数据恢复环境: 某单位一台某品牌型号为DS5300的服务器存储,1个机头+4个扩展柜,底层是2组分别由数十块硬盘组建的RAID5阵列。存储系统上层一共分了11个卷。 服务器存储故障&分析: 存储设备上一组raid5阵列上的2块磁盘出现故障,对应的硬盘指示灯亮黄灯,阵列崩溃,存储不可用。该组故障阵列上层存放的是Oracle数据库文件。
|
1月前
|
存储 Unix 数据挖掘
服务器数据恢复—SAN LUN映射出错导致文件系统共享冲突的数据恢复案例
服务器数据恢复环境: SAN光纤网络环境,存储由一组6块硬盘组建的RAID6阵列构成,划分为若干LUN,MAP到跑不同业务的SUN SOLARIS操作系统服务器上。 服务器故障&分析: 因为业务需要,用户在该光纤存储环境中新增一台SUN SOLARIS操作系统服务器。将存储中的某个LUN映射到新增的服务器上,但是映射的这个卷之前已经MAP到SOLARIS生产系统上的某个LUN上了。因为未及时察觉这个问题,新增服务器已经对该LUN进行部分初始化操作。 在SOLARIS操作系统层面磁盘报错,重启后卷无法挂载。联系SUN工程师检测后,执行了fsck操作。操作完成后虽然文件系统可以挂上,但是发现大量
|
2月前
|
存储 Oracle 关系型数据库
服务器数据恢复—存储硬盘故障导致映射到服务器上的卷挂载不上的数据恢复案例
一台存储上有一组由16块FC硬盘组建了一组raid。存储前面板上的对应10号和13号硬盘的故障灯亮起,存储映射到redhat linux操作系统服务器上的卷挂载不上,业务中断。
|
2月前
|
存储 Unix 数据挖掘
服务器数据恢复—SAN环境下LUN Mapping出错导致文件系统共享冲突的数据恢复案例
服务器数据恢复环境: SAN环境下一台存储设备中有一组由6块硬盘组建的RAID6磁盘阵列,划分若干LUN,MAP到不同业务的SOLARIS操作系统服务器上。 服务器故障: 用户新增了一台服务器,将存储中的某个LUN映射到新增加的这台服务器上。这个映射的LUN其实之前已经MAP到其他SOLARIS操作系统的服务器上了。由于没有及时发现问题,新增加的这台服务器已经对此LUN做了初始化操作,磁盘报错,重启后发现卷无法挂载。
|
3月前
|
存储 Oracle 关系型数据库
服务器数据恢复—raid5阵列硬盘离线导致上层LUN不可用的恢复数据案例
一台服务器上有8块SAS硬盘,其中的7块硬盘组建了一组RAID5阵列,另外1块硬盘作为热备盘使用。划分了6个LUN,服务器上部署有oracle数据库。 RAID5磁盘阵列中有2块硬盘出现故障并离线,RAID5阵列瘫痪,上层LUN无法正常使用。经过硬件工程师检测,所有硬盘(包括离线的2块盘)均无物理故障以及坏道。
 服务器数据恢复—raid5阵列硬盘离线导致上层LUN不可用的恢复数据案例
|
3月前
|
存储 Unix 数据挖掘
服务器数据恢复—SAN环境下LUN Mapping出错导致文件系统一致性出错的数据恢复案例
服务器存储数据恢复环境: 一台存储中有一组由6块硬盘组成的RAID6,划分为若干LUN,MAP到不同业务的SOLARIS操作系统服务器上。 服务器存储故障: 由于业务变化需要增加一台服务器,在存储在线的状态下将该存储中的某个LUN映射到这台新增加的服务器上并开始初始化,不料映射的这个LUN已经MAP到其他SOLARIS服务器上了。由于该LUN已经进行了部分的初始化,磁盘报错,重启后发现卷无法挂载。

相关产品

  • 云服务器 ECS
  • 下一篇
    无影云桌面