服务器数据恢复—Raid故障导致数据库数据丢失的数据恢复案例

本文涉及的产品
无影云电脑企业版,4核8GB 120小时 1个月
资源编排,不限时长
无影云电脑个人版,1个月黄金款+200核时
简介: 一台光纤存储中有一组由16块硬盘组成的raid。该存储出现故障导致数据丢失。RAID中2块盘掉线,还有1块盘smart状态为“警告”。

服务器存储数据恢复环境&故障情况:
一台光纤存储中有一组由16块硬盘组成的raid。
该存储出现故障导致数据丢失。RAID中2块盘掉线,还有1块盘smart状态为“警告”。

服务器存储数据恢复过程:

1、通过该存储自带的存储管理软件将当前存储的完整日志状态备份,解析备份出来的存储日志,获取到关于逻辑卷结构的部分信息。
2、在windows环境下把raid中状态正常的硬盘标记为脱机,然后将所有磁盘进行全盘镜像,在镜像过程中发现smart状态为“警告”的那块硬盘镜像速度异常缓慢,数据恢复工程师推测问题原因是该盘存在不稳定扇区和坏道。更换专业设备单独对该盘做镜像,将专业设备中的“遇到坏道响应”、“等待时间”和“跳过坏扇区数据”等参数进行调整后进行备份。
3、将存储中所有硬盘都镜像完成后,查看镜像工具生成的日志,发现在存储管理软件中和SMART状态中均没有发现问题的1块盘也存在坏道,掉线的2块盘均存在大量不规律的坏道分布。根据坏道列表定位到目标镜像文件,分析后发现该磁盘阵列中文件系统的部分关键数据处于坏道区。于是北亚企安数据恢复工程师通过同条带xor手动修复。
4、将备份出来的raid中的所有硬盘的数据展开,通过对ext3文件系统的逆向分析以及对日志文件的分析,获取到raid的盘序、raid块大小,raid的校验走向和校验方式等重组raid所必需的信息。
5、通过分析获取到的raid信息虚拟重组raid,然后解析ext3文件系统并提取数据库文件。
6、在提取数据库文件的过程中出现报错,数据库报告imp-0008错误。于是数据恢复工程师重新对raid结构进行分析,再一次提取dmp文件和dbf原始库文件,这回所有文件正常且无报错。

服务器存储中数据库数据恢复过程:
1、拷贝数据库文件到原服务器中/home/oracle/tmp/syntong目录下作为备份。在根目录下创建了一个oradata文件夹,将整个syntong文件夹拷贝到oradata目录下。然后更改oradata文件夹及其中所有文件的属组和权限。
2、备份原数据库环境,包括ORACLE_HOME下product文件夹下的相关文件。配置监听,使用原服务器中的splplus连接到数据库。尝试启动数据库到nomount状态。进行基本状态查询,发现环境和参数文件没有问题。 尝试启动数据库到mount状态,进行状态查询也没有发现问题。启动数据库到open状态。
出现报错:
ORA-01122: database file 1 failed verification check
ORA-01110: data file 1: '/oradata/syntong/system01.dbf'
ORA-01207: file is more recent than control file - old control file
3、经过进一步的检测和分析,初步判断出现此报错的原因是控制文件和数据文件信息不一致,这是一类通常由于断电或突然关机所引起的故障。
4、逐个检测数据库文件,没有发现有数据库文件被物理破坏。
5、在mount状态下备份控制文件,alter database backup controlfile to trace as ' /backup/controlfile'。查看&修改备份的控制文件,获取到其中的重建控制文件命令。将这些命令复制到一个新建脚本文件controlfile.sql中。
6、关闭数据库,删除/oradata/syntong/下的3个控制文件。 启动数据库到nomount状态,执行controlfile.sql脚本。
SQL>startup nomount
SQL>@controlfile.sql
7、重建控制文件后,直接启动数据库,再次报错,需要进一步处理。
SQL> alter database open;
alter database open
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: '/free/oracle/oradata/orcl/system01.dbf'
然后执行恢复命令:
recover database using backup controlfile until cancel;
Recovery of Online Redo Log: Thread 1 Group 1 Seq 22 Reading mem 0
Mem# 0 errs 0: /free/oracle/oradata/orcl/redo01.log

做介质恢复,直到返回报告,恢复完成。
8、尝试open数据库。
SQL> alter database open resetlogs;
9、数据库启动成功。把原来temp表空间的数据文件加入到对应的temp表空间中。
10、对数据库进行各种常规检查,没有发现任何错误。
11、进行emp备份。全库备份完成,没有报错。将应用程序连接到数据库,在应用层面验证数据,也没有发现问题。
12、经过用户方仔细检验后,确认恢复出来的数据库数据没有问题,认可数据恢复结果。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
1天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
12天前
|
存储 Oracle 关系型数据库
数据库数据恢复—ORACLE常见故障的数据恢复方案
Oracle数据库常见故障表现: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE ASM存储破坏。 3、ORACLE数据文件丢失。 4、ORACLE数据文件部分损坏。 5、ORACLE DUMP文件损坏。
48 11
|
10天前
|
安全 数据挖掘
服务器数据恢复—RAID5阵列中两块硬盘离线导致阵列崩溃的数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS接口硬盘组建的raid5阵列,两组raid5阵列划分LUN并由LVM管理,格式化为EXT3文件系统。 服务器故障: RAID5阵列中一块硬盘未知原因离线,热备盘自动激活上线替换离线硬盘。在热备盘上线过程中,raid5阵列中又有一块硬盘离线。热备盘同步失败,该raid阵列崩溃,LVM结构变得不完整,文件系统无法正常使用。
|
18天前
|
存储 运维 数据挖掘
服务器数据恢复—EVA存储中多块硬盘离线导致存储崩溃的数据恢复案例
一台HP EVA存储中有23块硬盘,挂接到一台windows server操作系统的服务器。 EVA存储上有三个硬盘指示灯亮黄灯,此刻存储还能正常使用。管理员在更换硬盘的过程中,又出现一块硬盘对应的指示灯亮黄灯,存储崩溃,无法使用了。
|
19天前
|
数据挖掘 Linux Windows
服务器数据恢复—服务器raid0数据恢复及数据迁移的案例
某品牌服务器上有一组由两块SAS硬盘组建的raid0阵列,上层是windows server操作系统+ntfs文件系统。服务器上一个硬盘指示灯显示黄颜色,该指示灯对应的硬盘离线,raid不可用。
|
2天前
|
存储 数据挖掘
服务器数据恢复—ZFS文件系统下数据恢复案例
服务器存储数据恢复环境: ZFS Storage 7320存储阵列中有32块硬盘。32块硬盘分为4组,每组8块硬盘,共组建了3组RAIDZ,每组raid都配置了热备盘。 服务器存储故障: 服务器存储运行过程中突然崩溃,排除人为误操作、断电、进水和其他机房不稳定因素。管理员重启服务器存储,系统无法进入,需要恢复服务器存储中的数据。
|
15天前
|
存储 Oracle 安全
服务器数据恢复—LINUX系统删除/格式化的数据恢复流程
Linux操作系统是世界上流行的操作系统之一,被广泛用于服务器、个人电脑、移动设备和嵌入式系统。Linux系统下数据被误删除或者误格式化的问题非常普遍。下面北亚企安数据恢复工程师简单聊一下基于linux的文件系统(EXT2/EXT3/EXT4/Reiserfs/Xfs) 下删除或者格式化的数据恢复流程和可行性。
|
17天前
|
存储 Oracle 关系型数据库
服务器数据恢复—华为S5300存储Oracle数据库恢复案例
服务器存储数据恢复环境: 华为S5300存储中有12块FC硬盘,其中11块硬盘作为数据盘组建了一组RAID5阵列,剩下的1块硬盘作为热备盘使用。基于RAID的LUN分配给linux操作系统使用,存放的数据主要是Oracle数据库。 服务器存储故障: RAID5阵列中1块硬盘出现故障离线,热备盘自动激活开始同步数据,在同步数据的过程中又一块硬盘离线,RAID5阵列瘫痪,上层LUN无法使用。
|
5天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
6天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。

相关产品

  • 云服务器 ECS
  • 下一篇
    DataWorks