服务器数据恢复—DS4700存储中raid出现故障的数据恢复案例

简介: 一台某品牌DS4700存储中有14块硬盘组建raid,存放的是oracle数据库。存储中有两块硬盘的指示灯亮黄色,raid崩溃,卷无法挂载,业务全部瘫痪。

服务器存储数据恢复环境&故障:
一台某品牌DS4700存储中有14块硬盘组建raid,存放的是oracle数据库。存储中有两块硬盘的指示灯亮黄色,raid崩溃,卷无法挂载,业务全部瘫痪。

服务器存储故障检测:
服务器数据恢复工程师通过IBM storage manager连接存储查看服务器存储的当前状态,发现逻辑卷状态失败。对物理磁盘状态进行查看,发现13号磁盘状态为“警告”,10号和11号磁盘状态为“失败”。通过IBM storage manager对当前存储的全部日志进行备份并解析逻辑卷结构信息。

服务器存储数据恢复过程:
1、将服务器存储中全部磁盘编号后取出槽位,由硬件工程师进行物理故障检测。经过初步检测,所有硬盘均可以正常识别,13号盘SMART状态为“警告”,和在IBM storage manager中的状态一致。
2、服务器数据恢复工程师在windows环境下的磁盘管理器中将可以识别的磁盘标记为脱机状态,使用工具将所有磁盘进行扇区级别镜像操作(在镜像过程中13号硬盘的镜像速度极其缓慢,初步判断该盘存在坏道或者不稳定/损坏扇区,需要使用专业设备处理)。在使用专业设备对13号硬盘做镜像的过程中观察镜像状态,发现13号盘的坏道并不多,只是存在大量不稳定扇区。调整该磁盘的镜像策略后继续镜像。镜像完成后将所有磁盘按照编号还原到原存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件查看生成的日志,发现在IBM storage manager和硬盘SMART状态中均没有发现异常的1号盘、10号和11号盘均存在大量不规律的坏道分布。结合坏道列表情况进行分析,EXT3文件系统中的部分关键性源数据处于坏道区域,北亚企安数据恢复工程师通过13号硬盘的镜像文件进行同一条带的xor,
并根据文件系统的上下关系手动修复损坏的文件系统。
4、通过对ext3文件系统的逆向以及日志文件的分析获取到盘序、raid校验方向、raid块大小、raid校验方式等信息,利用获取到的信息虚拟重组raid。重组完成后解析EXT3文件系统,将oracle数据库中的dmp文件进行部分提取。
5、在恢复dmp的过程中出现内容为“imp-0008”的报错,经过分析发现报错原因是dmp文件有问题。再次重组raid并重新导出dmp文件和dbf原始库文件进行测试,dbf原始库文件均能通过测试。
6、把数据库文件拷贝到原数据库服务器中,路径为“/home/oracle/tmp/syntong”。在根目录下创建一个oradata文件夹,把整个syntong文件夹拷贝到oradata目录下,更改oradata文件夹及其所有文件的属组和权限。
7、备份原数据库环境,包括ORACLE_HOME下product文件夹下的相关文件。配置监听,使用splplus连接到数据库,尝试启动数据库到nomount状态。进行状态查询没有发现环境和参数文件有问题。 尝试启动数据库到mount状态,进行状态查询没有问题。启动数据库到open状态。出现报错:
ORA-01122: database file 1 failed verification check
ORA-01110: data file 1: '/oradata/syntong/system01.dbf'
ORA-01207: file is more recent than control file - old control file
经过检测和分析,判断此故障为控制文件和数据文件信息不一致,这是一种常见的由于异常关机所引起的故障。
8、对数据库文件进行逐个检测,经过检测没有发现有数据库文件存在物理损毁的情况。
9、在mount状态下备份控制文件,alter database backup controlfile to trace as ' /backup/controlfile';对备份的控制文件进行查看修改,获取到其中的重建控制文件命令。把这些命令复制到一个新建脚本文件controlfile.sql中。
10、关闭数据库,删除/oradata/syntong/下的3个控制文件。 启动数据库到nomount状态,执行controlfile.sql 脚本。
SQL>startup nomount
SQL>@controlfile.sql
11、重建控制文件后,直接启动数据库报错,需要进一步处理。
SQL> alter database open;
alter database open
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: '/free/oracle/oradata/orcl/system01.dbf'
然后执行恢复命令:
recover database using backup controlfile until cancel;
Recovery of Online Redo Log: Thread 1 Group 1 Seq 22 Reading mem 0
Mem# 0 errs 0: /free/oracle/oradata/orcl/redo01.log

做介质恢复,直到返回报告,恢复完成。
12、尝试open数据库。
SQL> alter database open resetlogs;
13、数据库启动成功。把原来temp表空间的数据文件加入到对应的temp表空间中。
14、对数据库进行各种常规检查,没有发现任何错误。
15、进行emp备份,全库备份完成,没有报错。将应用程序连接到数据库,进行应用层面的数据验证,一切正常,本次数据恢复工作完成。

相关文章
|
6月前
|
存储 运维 数据挖掘
服务器数据恢复—EqualLogic存储硬盘出现坏道的数据恢复案例
某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。磁盘阵列上层划分多个大小不同的卷,存放虚拟机文件。 硬盘出现故障导致存储阵列不可用,需要恢复存储阵列中的数据。
|
6月前
|
存储 运维 Oracle
服务器数据恢复—存储硬盘指示灯亮黄灯,RAID5阵列崩溃的数据恢复案例
服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块的硬盘组建了两组RAID5阵列。一组raid5阵列有27块硬盘,存放Oracle数据库文件。存储系统上层一共划分了11个卷。 服务器存储故障: 存储设备上两个硬盘指示灯亮黄色。其中一组RAID5阵列崩溃,存储不可用,设备已经过保。
|
7月前
|
Unix 应用服务中间件 索引
服务器数据恢复—LUN映射出错导致文件系统共享冲突的数据恢复案例
SUN光纤存储系统中有一组由6个硬盘组建的RAID6,划分为若干LUN,MAP到跑不同业务的服务器上,这些服务器上运行的是SOLARIS操作系统。 服务器不存在物理故障。由于公司业务变化,需要增加一台服务器跑新的应用。服务器管理员在原服务器在线的状态下,将其中一个lun映射到一台新服务器上。实际上,这个刚映射过去的卷已经map到了solaris生产系统上的某个lun上了。映射到新服务器后,服务器对这个卷进行初始化的操作,原solaris系统上的磁盘报错,重启服务器后这个卷已经无法挂载。 服务器管理员寻求sun原厂工程师的帮助。sun工程师检测后执行了fsck操作。执行完成后文件系统挂载成功。查
|
6月前
|
存储 SQL 关系型数据库
服务器数据恢复—raid崩溃导致同友存储无法启动的数据恢复
某单位同友存储,存储中有一组raid5磁盘阵列。存储内部共有虚拟机若干台,raid5阵列崩溃导致存储无法启动。
|
7月前
|
存储 数据挖掘 Windows
服务器数据恢复—RAIDZ上层ZFS文件系统数据恢复案例
一台服务器有32块硬盘,采用Windows操作系统。 服务器在正常运行的时候突然变得不可用。没有异常断电、进水、异常操作、机房不稳定等外部因素。服务器管理员重启服务器,但是服务器无法进入系统。管理员联系北亚企安数据恢复工程师要求恢复服务器数据。
|
6月前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
507 10
|
6月前
|
运维 安全 Ubuntu
阿里云渠道商:服务器操作系统怎么选?
阿里云提供丰富操作系统镜像,涵盖Windows与主流Linux发行版。选型需综合技术兼容性、运维成本、安全稳定等因素。推荐Alibaba Cloud Linux、Ubuntu等用于Web与容器场景,Windows Server支撑.NET应用。建议优先选用LTS版本并进行测试验证,通过标准化镜像管理提升部署效率与一致性。
|
6月前
|
弹性计算 ice
阿里云4核8g服务器多少钱一年?1个月和1小时价格,省钱购买方法分享
阿里云4核8G服务器价格因实例类型而异,经济型e实例约159元/月,计算型c9i约371元/月,按小时计费最低0.45元。实际购买享折扣,1年最高可省至1578元,附主流ECS实例及CPU型号参考。
644 8
|
6月前
|
存储 监控 安全
阿里云渠道商:云服务器价格有什么变动?
阿里云带宽与存储费用呈基础资源降价、增值服务差异化趋势。企业应结合业务特点,通过阶梯计价、智能分层、弹性带宽等策略优化成本,借助云监控与预算预警机制,实现高效、可控的云资源管理。
|
6月前
|
弹性计算 运维 安全
区别及选择指南:阿里云轻量应用服务器与ECS云服务器有什么区别?
阿里云轻量应用服务器适合个人开发者、学生搭建博客、测试环境,易用且性价比高;ECS功能更强大,适合企业级应用如大数据、高流量网站。根据需求选择:轻量入门首选,ECS专业之选。
434 2

热门文章

最新文章

相关产品

  • 云服务器 ECS
  • 下一篇
    开通oss服务