一例IBM服务器Raid磁盘阵列故障

简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zergskj/article/details/6303433 通常我们在服务器上做了硬件层面的Raid之后,用户拔掉任意一块硬盘,系统仍然能够正常工作。
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zergskj/article/details/6303433

通常我们在服务器上做了硬件层面的Raid之后,用户拔掉任意一块硬盘,系统仍然能够正常工作。

不巧的是,某些情况下,由于疏忽大意,往往会造成意外的发生,今天就遇到了客户同时拔掉了奇偶校验的两块硬盘,而且是CMS的生产服务器,包括Oracle数据库【OMG!】

在ssh的终端直接抛出了一个io error后,整个Centos系统就崩溃了,不接受任何指令,包括reboot,

倒是tomcat竟然还能工作,这里小赞许一下,但好像servlet也不行了。

到机房直接断电重启,系统已经无法启动。服务器反复加载硬件,到硬盘这一步时,始终过不去,提示error。

按系统提示输入C键,进入Raid阵列管理,发现已经有两块磁盘Offline,badluck!

尝试将磁盘设置为Online,发现没有相关选项。

……经过IBM工程师一番折腾之后,操作系统总算恢复正常。但Oracle好像有点不太对头:

启动Oracle出现如下错误提示:

ORA-01113: file 3 needs media recovery

ORA-01110: data file 3: '/oracle/app/oradata/orcl/sysaux01.dbf'

按照提示要求执行:

sql >recovery datafile 3;

提示修复成功

但重启数据库后,在startup.log中又抛出如下错误:

ORA-00607: Internal error occurred while making a change to a data block
ORA-00600: internal error code, arguments: [4194], [49], [24], [], [], [], [],

看样子,Oracle在尝试回滚最近的数据时,遇到了麻烦。

OK,稀里糊涂搜索一通后,得到了一个相近的答案:

重建UNDO

SQL> startup mount
ORACLE instance started.
Total System Global Area  599785472 bytes
Fixed Size                  1220772 bytes
Variable Size             125833052 bytes
Database Buffers          465567744 bytes
Redo Buffers                7163904 bytes
Database mounted.

SQL> create undo tablespace undotbs02 datafile '/home/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100m
  2  ;
create undo tablespace undotbs02 datafile '/home/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100m
*
ERROR at line 1:
ORA-01109: database not open
SQL> select name from v$datafile;
NAME
--------------------------------------------------------------------------------
/home/u01/app/oracle/oradata/orcl/system01.dbf
/home/u01/app/oracle/oradata/orcl/undotbs01.dbf
/home/u01/app/oracle/oradata/orcl/sysaux01.dbf
/home/u01/app/oracle/oradata/orcl/users01.dbf
SQL> alter database datafile '/home/u01/app/oracle/oradata/orcl/undotbs01.dbf' offline drop;
Database altered.
SQL> alter database open;
Database altered.
SQL> archive log list;
Database log mode              No Archive Mode
Automatic archival             Disabled
Archive destination            USE_DB_RECOVERY_FILE_DEST
Oldest online log sequence     1056
Current log sequence           1058
SQL> create undo tablespace undotbs2 datafile '/home/u01/app/oracle/oradata/orcl/undotbs02.dbf' size 100m;
Tablespace created.
SQL> ALTER SYSTEM SET undo_tablespace='UNDOTBS2' ;
System altered.

通过以上设置,再次重启数据库,ok,一切恢复正常!

由此得出一个重要教训:服务器上的东西不要随便插入拔出smile02.gif

[此文在实际操作过程中发现日志中仍然存在警告,有异常,5个小时后,Oracle再次停掉]

【建议重新安装Oracle,Oracle修复过于复杂,除非有重要数据,不建议继续修复】

相关文章
|
5月前
|
存储 数据挖掘
服务器数据恢复—EMC存储raid5阵列数据恢复案例
服务器存储数据恢复环境: EMC某型号存储中有一组由8块硬盘组建的raid5磁盘阵列。 服务器存储故障: raid5阵列中有2块硬盘离线,存储不可用,上层应用崩了。
|
6月前
|
存储 固态存储 文件存储
服务器数据恢复—NAS存储精简lv的故障的数据恢复案例
NAS数据恢复环境: QNAP TS-532X NAS设备中有两块1T的SSD固态硬盘和3块5T的机械硬盘。三块机械硬盘组建了一组RAID5阵列,两块固态硬盘组建RAID1阵列。划分了一个存储池,并通过精简LVM划分了7个lv。 NAS故障: 硬盘故障导致无法正常进入系统,7个lv分区丢失。
|
7月前
|
存储 Linux 数据库
服务器数据恢复—raid5阵列中多块硬盘出现坏道的数据恢复案例
服务器存储数据恢复环境: 某品牌DS3512存储中有一组由6块SAS磁盘组建的raid5阵列。划分一个lun分配给Linux系统服务器,并格式化成ocfs2文件系统,共享给虚拟化使用,存放虚拟机文件。 存储中的数据包括:数十台iunx系统虚拟机和windows系统虚拟机、压缩包文件、配置文件。 服务器存储故障: raid5阵列中多块硬盘出现问题,阵列崩溃,数据丢失。
|
7月前
|
存储 数据挖掘 数据库
服务器数据恢复—服务器raid磁盘出现故障的数据恢复案例
一台服务器中有一组由三块SAS硬盘组建的raid阵列。服务器上部署的数据库存储在D分区,数据库备份存储在E分区。 服务器上一块硬盘指示灯显示红色。D分区不可识别。E分区虽然可以识别,但是E分区拷贝文件报错。 管理员重启服务器,先离线的硬盘上线开始同步数据,同步没有完成的情况下管理员将服务器强制关机,之后没有动过服务器。
|
3月前
|
Oracle 安全 关系型数据库
服务器数据恢复—热备盘未成功激活导致raid崩溃的数据恢复案例
一台服务器中有5块硬盘,其中的4块组建了一组RAID5阵列,剩下一块盘作为热备盘(Hot-Spare)使用。服务器操作系统为linux,应用系统为构架于oracle数据库的一个oa。 raid5阵列中一块盘离线,但热备盘未自动激活rebuild。直到另外一块盘离线,RAID崩溃。 由于oracle已经不再对本案例中的oa系统提供后续支持,用户方要求尽可能恢复数据和操作系统。经过检测发现热备盘完全没有启用,硬盘无明显物理故障,无明显同步表现。
|
4月前
服务器数据恢复—服务器raid5阵列2块硬盘掉线的数据恢复案例
某品牌型号为X3850服务器上有一组由14块数据盘和1块热备盘组建的raid5磁盘阵列。 服务器在正常使用过程中突然崩溃,管理员查看raid5阵列故障情况的时发现磁盘阵列中有2块硬盘掉线,但是热备盘没有启用。
|
7月前
|
存储 安全 Linux
服务器数据恢复—如何预防服务器故障?服务器发生故障如何恢复数据?
服务器常见故障: 硬件故障:磁盘损坏、电池故障等。 软件问题:操作系统崩溃、未知的程序运行错误等。 病毒破坏:勒索病毒加密、删除服务器数据等。 不可控力量;服务器浸水、火烧、机房倒塌等导致服务器损坏和数据丢失。 误操作:工作人员操作失误导致数据丢失,如格式化、删除、覆盖等。
297 16
服务器数据恢复—如何预防服务器故障?服务器发生故障如何恢复数据?
|
5月前
|
存储 数据挖掘
服务器数据恢复—V7000存储上raid5阵列多块硬盘离线的数据恢复方案
V7000存储设备上raid5阵列上一块硬盘出现故障离线,热备盘自动启用开始同步数据。热备盘数据同步还没有结束的情况下,与离线盘处于同一组Mdisk中的另一块磁盘离线。热备盘同步失败,该组Mdisk失效,通用卷无法使用。
|
6月前
|
数据挖掘 索引
服务器数据恢复—raid6阵列硬盘故障导致上层虚拟机不可用的数据恢复案例
一台由16块硬盘组成的raid6磁盘阵列。磁盘阵列中有一块硬盘因为物理故障掉线,导致服务器上层虚拟机无法正常使用,部分分区丢失,重启物理服务器后发现数据丢失。
|
7月前
|
存储 运维 数据挖掘
服务器数据恢复—Raid5磁盘阵列数据恢复案例
服务器数据恢复环境: 某公司一台存储上有一组由15块硬盘组建的raid5阵列。raid5阵列上层是一个xfs裸分区,起始位置是0扇区。 服务器故障: raid5阵列中有一块硬盘出现故障掉线,热备盘自动上线同步数据,数据同步还没有完成的情况下磁盘阵列中又有一块硬盘掉线,数据同步过程中断,阵列崩溃。

热门文章

最新文章