服务器数据恢复—DS4700存储中raid出现故障的数据恢复案例

本文涉及的产品
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,1个月黄金款+200核时
资源编排,不限时长
简介: 一台某品牌DS4700存储中有14块硬盘组建raid,存放的是oracle数据库。存储中有两块硬盘的指示灯亮黄色,raid崩溃,卷无法挂载,业务全部瘫痪。

服务器存储数据恢复环境&故障:
一台某品牌DS4700存储中有14块硬盘组建raid,存放的是oracle数据库。存储中有两块硬盘的指示灯亮黄色,raid崩溃,卷无法挂载,业务全部瘫痪。

服务器存储故障检测:
服务器数据恢复工程师通过IBM storage manager连接存储查看服务器存储的当前状态,发现逻辑卷状态失败。对物理磁盘状态进行查看,发现13号磁盘状态为“警告”,10号和11号磁盘状态为“失败”。通过IBM storage manager对当前存储的全部日志进行备份并解析逻辑卷结构信息。

服务器存储数据恢复过程:
1、将服务器存储中全部磁盘编号后取出槽位,由硬件工程师进行物理故障检测。经过初步检测,所有硬盘均可以正常识别,13号盘SMART状态为“警告”,和在IBM storage manager中的状态一致。
2、服务器数据恢复工程师在windows环境下的磁盘管理器中将可以识别的磁盘标记为脱机状态,使用工具将所有磁盘进行扇区级别镜像操作(在镜像过程中13号硬盘的镜像速度极其缓慢,初步判断该盘存在坏道或者不稳定/损坏扇区,需要使用专业设备处理)。在使用专业设备对13号硬盘做镜像的过程中观察镜像状态,发现13号盘的坏道并不多,只是存在大量不稳定扇区。调整该磁盘的镜像策略后继续镜像。镜像完成后将所有磁盘按照编号还原到原存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件查看生成的日志,发现在IBM storage manager和硬盘SMART状态中均没有发现异常的1号盘、10号和11号盘均存在大量不规律的坏道分布。结合坏道列表情况进行分析,EXT3文件系统中的部分关键性源数据处于坏道区域,北亚企安数据恢复工程师通过13号硬盘的镜像文件进行同一条带的xor,
并根据文件系统的上下关系手动修复损坏的文件系统。
4、通过对ext3文件系统的逆向以及日志文件的分析获取到盘序、raid校验方向、raid块大小、raid校验方式等信息,利用获取到的信息虚拟重组raid。重组完成后解析EXT3文件系统,将oracle数据库中的dmp文件进行部分提取。
5、在恢复dmp的过程中出现内容为“imp-0008”的报错,经过分析发现报错原因是dmp文件有问题。再次重组raid并重新导出dmp文件和dbf原始库文件进行测试,dbf原始库文件均能通过测试。
6、把数据库文件拷贝到原数据库服务器中,路径为“/home/oracle/tmp/syntong”。在根目录下创建一个oradata文件夹,把整个syntong文件夹拷贝到oradata目录下,更改oradata文件夹及其所有文件的属组和权限。
7、备份原数据库环境,包括ORACLE_HOME下product文件夹下的相关文件。配置监听,使用splplus连接到数据库,尝试启动数据库到nomount状态。进行状态查询没有发现环境和参数文件有问题。 尝试启动数据库到mount状态,进行状态查询没有问题。启动数据库到open状态。出现报错:
ORA-01122: database file 1 failed verification check
ORA-01110: data file 1: '/oradata/syntong/system01.dbf'
ORA-01207: file is more recent than control file - old control file
经过检测和分析,判断此故障为控制文件和数据文件信息不一致,这是一种常见的由于异常关机所引起的故障。
8、对数据库文件进行逐个检测,经过检测没有发现有数据库文件存在物理损毁的情况。
9、在mount状态下备份控制文件,alter database backup controlfile to trace as ' /backup/controlfile';对备份的控制文件进行查看修改,获取到其中的重建控制文件命令。把这些命令复制到一个新建脚本文件controlfile.sql中。
10、关闭数据库,删除/oradata/syntong/下的3个控制文件。 启动数据库到nomount状态,执行controlfile.sql 脚本。
SQL>startup nomount
SQL>@controlfile.sql
11、重建控制文件后,直接启动数据库报错,需要进一步处理。
SQL> alter database open;
alter database open
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: '/free/oracle/oradata/orcl/system01.dbf'
然后执行恢复命令:
recover database using backup controlfile until cancel;
Recovery of Online Redo Log: Thread 1 Group 1 Seq 22 Reading mem 0
Mem# 0 errs 0: /free/oracle/oradata/orcl/redo01.log

做介质恢复,直到返回报告,恢复完成。
12、尝试open数据库。
SQL> alter database open resetlogs;
13、数据库启动成功。把原来temp表空间的数据文件加入到对应的temp表空间中。
14、对数据库进行各种常规检查,没有发现任何错误。
15、进行emp备份,全库备份完成,没有报错。将应用程序连接到数据库,进行应用层面的数据验证,一切正常,本次数据恢复工作完成。

相关文章
|
3天前
|
存储 数据挖掘 数据库
服务器数据恢复—OceanStor存储数据恢复案例
华为OceanStor T系列某型号存储中有一组由24块机械硬盘组建的一组RAID5阵列。 运行过程中该存储设备RAID5阵列上多块硬盘出现故障离线,阵列失效,存储中数据无法访问。
|
1天前
|
存储 数据挖掘
服务器数据恢复—zfs文件系统服务器数据恢复案例
一台配有32块硬盘的服务器在运行过程中突然崩溃不可用。经过初步检测,基本上确定服务器硬件不存在物理故障。管理员重启服务器后问题依旧。需要恢复该服务器中的数据。
|
3天前
|
机器学习/深度学习 人工智能 PyTorch
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
|
2天前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。
|
9天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
9天前
|
开发框架 缓存 .NET
阿里云轻量应用服务器、经济型e、通用算力型u1实例怎么选?区别及选择参考
在阿里云目前的活动中,价格比较优惠的云服务器有轻量应用服务器2核2G3M带宽68元1年,经济型e实例2核2G3M带宽99元1年,通用算力型u1实例2核4G5M带宽199元1年,这几个云服务器是用户关注度最高的。有的新手用户由于是初次使用阿里云服务器,对于轻量应用服务器、经济型e、通用算力型u1实例的相关性能并不是很清楚,本文为大家做个简单的介绍和对比,以供参考。
|
17天前
|
弹性计算 运维 安全
阿里云轻量应用服务器与ECS的区别及选择指南
轻量应用服务器和云服务器ECS(Elastic Compute Service)是两款颇受欢迎的产品。本文将对这两者进行详细的对比,帮助用户更好地理解它们之间的区别,并根据自身需求做出明智的选择。
|
18天前
|
SQL 弹性计算 安全
阿里云上云优选与飞天加速计划活动区别及购买云服务器后续必做功课参考
对于很多用户来说,购买云服务器通常都是通过阿里云当下的各种活动来购买,这就有必要了解这些活动的区别,同时由于活动内的云服务器购买之后还需要单独购买并挂载数据盘,还需要设置远程密码以及安全组等操作之后才能正常使用云服务器。本文就为大家介绍一下目前比较热门的上云优选与飞天加速计划两个活动的区别,以及通过活动来购买云服务器之后的一些必做功课,确保云服务器可以正常使用,以供参考。
|
21天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)
|
2月前
|
存储 人工智能 弹性计算
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
62 6

相关产品

  • 云服务器 ECS