服务器数据恢复—光纤存储上oracle数据库数据恢复案例

本文涉及的产品
RDS AI 助手,专业版
PolarDB Agent Express,2核4GB
PolarDB Agent Flow,2核4GB
简介: 一台光纤服务器存储上有16块FC硬盘,上层部署了Oracle数据库。服务器存储前面板2个硬盘指示灯显示异常,存储映射到linux操作系统上的卷挂载不上,业务中断。通过storage manager查看存储状态,发现逻辑卷状态失败。再查看物理磁盘状态,发现其中一块盘报告“警告”,硬盘指示灯显示异常的2块盘报告“失败”。将当前存储的完整日志状态备份下来,解析备份出来的存储日志并获得了关于逻辑卷结构的部分信息。

服务器存储数据恢复环境&故障:
一台光纤服务器存储上有16块FC硬盘,上层部署了Oracle数据库。服务器存储前面板2个硬盘指示灯显示异常,存储映射到linux操作系统上的卷挂载不上,业务中断。
通过storage manager查看存储状态,发现逻辑卷状态失败。再查看物理磁盘状态,发现其中一块盘报告“警告”,硬盘指示灯显示异常的2块盘报告“失败”。
将当前存储的完整日志状态备份下来,解析备份出来的存储日志并获得了关于逻辑卷结构的部分信息。
将16块硬盘做好标记后从存储中移除,对16块FC盘进行测试发现16块盘均能正常识别。检测16块盘的SMART状态,结果和在storage manager中的报告一致。

服务器存储数据恢复过程:
1、以只读方式将所有磁盘进行扇区级别镜像操作。在镜像过程中发现其中一块磁盘的镜像速度很慢,结合先前检测结果综合判断,该盘应该存在大量损坏以及不稳定扇区。对该硬盘进行坏道镜像操作,在镜像过程中同时观察镜像的速度和稳定性,发现该盘的坏道并不多,但是存在大量的读取响应时间长的不稳定扇区。调整拷贝策略后继续对该盘进行镜像,同时观察剩余盘镜像的情况。
2、镜像完成后查看日志,发现在storage manager和硬盘SMART状态均没有报错的一块也存在坏道,硬盘指示灯显示异常的2块盘均存在大量不规律的坏道分布。
ext3文件系统部分关键源数据信息被坏道破坏,只能等待所有磁盘镜像完毕后,通过同一条带进行xor以及根据文件系统上下文关系的方式手动修复被损坏的文件系统。
3、虽然镜像速度很慢的那块盘镜像完成,但是拷贝策略导致现在的镜像是不完整的,调整拷贝策略,继续镜像被跳过的扇区,直到该盘所有扇区全部镜像完毕。
4、所有硬盘镜像完成后,将所有硬盘按照标记还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行。避免后续操作对原始磁盘数据造成二次破坏。将所有镜像文件全部发开,根据对ext3文件系统的逆向以及日志文件的分析,获取到16块FC盘在存储中的盘序,RAID的块大小,RAID的校验走向和方式等信息。利用这些信息虚拟重组RAID,RAID搭建完成后进一步解析ext3文件系统。和用户方沟通后提取出了一些oracle的dmp文件,尝试进行恢复。
5、在通过dmp文件恢复数据的过程中,数据库报告imp-0008错误。北亚企安数据恢复工程师分析导入dmp文件的日志文件后,发现恢复的dmp文件存在问题。
6、重新分析raid结构,进一步确定ext3文件系统被破坏的程度。重新恢复dmp文件和dbf原始库文件,将恢复出来的dmp文件移交给用户进行数据导入测试,测试结果顺利且没有发现问题。对恢复出来的dbf原始库文件进行校验检测,所有文件均能通过测试。

oracle数据库恢复过程:
1、拷贝数据库文件到原数据库服务器上的一个文件夹中作为备份。在根目录下创建了一个oradata文件夹,并把备份的整个文件夹拷贝到oradata目录下。更改oradata文件夹及其所有文件的属组和权限。
2、备份原数据库环境,包括ORACLE_HOME下product文件夹下的相关文件。
配置监听,使用splplus连接到数据库。尝试启动数据库到nomount状态。进行基本状态查询后,了解到环境和参数文件没有问题。 尝试启动数据库到mount状态,进行状态查询没有问题。启动数据库到open状态时出现报错。
1.png

3、经过进一步的检测和分析,北亚企安数据恢复工程师判断此故障为控制文件和数据文件信息不一致导致,这是一类因断电或突然关机导致的故障。
4、对数据库文件进行逐个检测,发现所有数据文件没有物理损坏。
5、在mount状态下,对控制文件进行备份;对备份的控制文件进行查看修改,取得其中的重建控制文件命令。把这些命令复制到一个新建脚本文件controlfile.sql中。
6、关闭数据库,删除备份文件夹下的3个控制文件。 启动数据库到nomount状态,执行controlfile.sql 脚本。
2.png

7、重建控制文件完成后直接启动数据库,仍然报错,需要进一步处理。
3.png

执行恢复命令做介质恢复,直到返回报告,恢复完成。
4.png

8、尝试open数据库,数据库启动成功。把原来temp表空间的数据文件加入到对应的temp表空间中。
9、对数据库进行各种常规检查,没有发现任何错误。
10、进行emp备份。全库备份完成,没有报错。将应用程序连接到数据库,进行应用层面的数据验证。
11、数据验证过程没有发现任何问题,数据库修复完成。本次数据恢复工作完成。

相关文章
|
8月前
|
存储 运维 数据挖掘
服务器数据恢复—EqualLogic存储硬盘出现坏道的数据恢复案例
某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。磁盘阵列上层划分多个大小不同的卷,存放虚拟机文件。 硬盘出现故障导致存储阵列不可用,需要恢复存储阵列中的数据。
|
8月前
|
存储 运维 Oracle
服务器数据恢复—存储硬盘指示灯亮黄灯,RAID5阵列崩溃的数据恢复案例
服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘组建了两组RAID5阵列。一组raid5阵列有27块硬盘,存放Oracle数据库文件。存储系统上层一共划分了11个卷。 服务器存储故障: 存储设备上两个硬盘指示灯亮黄色。其中一组RAID5阵列崩溃,存储不可用,设备已经过保。
|
8月前
|
存储 运维 数据挖掘
服务器数据恢复—Raid5阵列2块硬盘损坏,热备盘未激活的数据恢复
EMC存储上有一组由多块stat硬盘组建的raid5磁盘阵列,该raid5阵列中有两块热备盘。上层采用的是zfs文件系统。 raid5阵列中2块硬盘出现故障,只有一块热备盘激活。
|
9月前
|
Unix 应用服务中间件 索引
服务器数据恢复—LUN映射出错导致文件系统共享冲突的数据恢复案例
SUN光纤存储系统中有一组由6个硬盘组建的RAID6,划分为若干LUN,MAP到跑不同业务的服务器上,这些服务器上运行的是SOLARIS操作系统。 服务器不存在物理故障。由于公司业务变化,需要增加一台服务器跑新的应用。服务器管理员在原服务器在线的状态下,将其中一个lun映射到一台新服务器上。实际上,这个刚映射过去的卷已经map到了solaris生产系统上的某个lun上了。映射到新服务器后,服务器对这个卷进行初始化的操作,原solaris系统上的磁盘报错,重启服务器后这个卷已经无法挂载。 服务器管理员寻求sun原厂工程师的帮助。sun工程师检测后执行了fsck操作。执行完成后文件系统挂载成功。查
|
9月前
|
SQL 关系型数据库 MySQL
Mysql数据恢复—Mysql数据库delete删除后数据恢复案例
本地服务器,操作系统为windows server。服务器上部署mysql单实例,innodb引擎,独立表空间。未进行数据库备份,未开启binlog。 人为误操作使用Delete命令删除数据时未添加where子句,导致全表数据被删除。删除后未对该表进行任何操作。需要恢复误删除的数据。 在本案例中的mysql数据库未进行备份,也未开启binlog日志,无法直接还原数据库。
|
8月前
|
存储 SQL 关系型数据库
服务器数据恢复—raid崩溃导致同友存储无法启动的数据恢复
某单位同友存储,存储中有一组raid5磁盘阵列。存储内部共有虚拟机若干台,raid5阵列崩溃导致存储无法启动。
|
9月前
|
存储 数据挖掘 Windows
服务器数据恢复—RAIDZ上层ZFS文件系统数据恢复案例
一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管理员重启服务器,但是服务器无法进入系统。管理员联系北亚企安数据恢复工程师要求恢复服务器数据。
|
9月前
|
存储
服务器数据恢复—服务器断电导致数据丢失的数据恢复案例
某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启服务器后发现服务器无法正常工作。 根据描述的故障发生过程,北亚企安数据恢复工程师推断故障是意外断电导致raid模块损坏。
|
8月前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
688 10
|
8月前
|
弹性计算 ice
阿里云4核8g服务器多少钱一年?1个月和1小时价格,省钱购买方法分享
阿里云4核8G服务器价格因实例类型而异,经济型e实例约159元/月,计算型c9i约371元/月,按小时计费最低0.45元。实际购买享折扣,1年最高可省至1578元,附主流ECS实例及CPU型号参考。
789 8

推荐镜像

更多