IBM HA双机光交链路问题导致的oracle数据库exp备份问题

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:     12月份,上地机房进行电源割接,不少光线交换机重启,业务系统、数据库主机也进行了重启,但是由于设备重启顺序不同导致一内容拨测系统数据库出现了异常。     出问题的数据库所在主机是IBM的AIX 6100,数据库版本是11.2.0.4,采用的是HA双机软件管理的热备双机,数据库安排的有exp定时计划任务。
    12月份,上地机房进行电源割接,不少光线交换机重启,业务系统、数据库主机也进行了重启,但是由于设备重启顺序不同导致一内容拨测系统数据库出现了异常。
    出问题的数据库所在主机是IBM的AIX 6100,数据库版本是11.2.0.4,采用的是HA双机软件管理的热备双机,数据库安排的有exp定时计划任务。
    出现的问题是:数据库exp定时备份计划任务出现告警,
    处理过程:
使用ps -ef|grep exp发现后台有3个exp相关的.sh备份进程挂起;
查看备份目录发现有3天前的备份文件和备份日志,但是备份文件是4096字节,而备份日志是0字节;
首先杀死3个相关的exp备份进程,删除失败的备份日志和备份文件,重新发起exp备份,发现备份卡在登录sqlplus 2个小时候自动断开,而备份文件还是4096字节,备份日志是0字节;
从服务器端登录sqlplus,select username from dba_users;能查询到数据库相关用户,select file_name,tablespace_name from dba_data_files;却一直卡主没有输出结果;
退出sqlplus切换到root用户lsvg能输出相关vg信息,lsvg -p rootvg显示rootvg相关的2个pv卷信息,但是lsvg -p vg_oravg却是卡主没有输出;
经AIX主机工程师查看并与系统管理员沟通判断是电源切割引起光交链路发生改变,而AIX主机不识别链路导致的;
尝试使用root 通过smit hacmp将服务切换到备机解决链路不识别问题,发现HA切换失败;
接下来重启HA相关的2个主机,重启完成后lsvg -p vg_oravg有正常输出,登录数据库查询数据文件正常,重新发起exp备份4分钟完成;
到此故障解决。
        
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
打赏
0
0
0
0
1
分享
相关文章
PolarDB开源数据库进阶课5 在线备份
本文介绍了如何在PolarDB RAC一写多读集群中进行在线备份,特别针对共享存储模式。通过使用`polar_basebackup`工具,可以将实例的本地数据和共享数据备份到本地盘中。实验环境依赖于Docker容器中用loop设备模拟的共享存储。
43 1
【赵渝强老师】Oracle数据库的闪回表
本文介绍了Oracle数据库中的闪回表(Flashback Table)功能,它能够将表的数据快速恢复到特定时间点或系统改变号(SCN),无需备份。文章通过实战示例详细演示了如何使用闪回表恢复数据,包括授权、创建测试表、记录时间与SCN号、删除数据、启用行移动功能、执行闪回操作以及验证恢复结果等步骤。同时,还展示了如何通过触发器禁止插入操作,并在闪回过程中处理触发器的启用问题。文末附有视频讲解,帮助读者更好地理解闪回表的使用方法。
24 10
【赵渝强老师】Oracle数据库的闪回查询
本文介绍了Oracle数据库的闪回查询(Flashback Query)功能及其实际应用。闪回查询通过`AS OF`子句,结合时间戳或SCN号,可查询历史数据状态,帮助分析数据差异。文中通过具体示例演示了如何使用闪回查询:创建测试表、记录当前SCN号、更新数据并提交事务,最后通过闪回查询获取历史数据。附带的视频和代码块详细展示了操作步骤与结果。
崖山异构数据库迁移利器YMP初体验-Oracle迁移YashanDB
文章是作者小草对崖山异构数据库迁移利器 YMP 的初体验分享,包括背景、YMP 简介、体验环境说明、YMP 部署(含安装前准备、安装、卸载、启动与停止)、数据迁移及遇到的问题与解决过程。重点介绍了 YMP 功能、部署的诸多细节和数据迁移流程,还提到了安装和迁移中遇到的问题及解决办法。
定期备份数据库:基于 Shell 脚本的自动化方案
本篇文章分享一个简单的 Shell 脚本,用于定期备份 MySQL 数据库,并自动将备份传输到远程服务器,帮助防止数据丢失。
【赵渝强老师】Oracle数据库的闪回技术
在Oracle数据库操作中,难免会遇到误删表或提交错误事务等问题,可能导致数据丢失甚至数据库停止运行。传统解决方法依赖备份恢复,但需提前准备正确备份。为此,Oracle提供了闪回技术,无需备份即可快速恢复数据。它支持7种类型的操作,如闪回查询、版本查询、表恢复等,能有效应对逻辑损坏和用户错误。闪回技术基于还原(undo)数据管理,启用自动管理后可实现高效恢复。
【赵渝强老师】Oracle数据库的客户端工具
本文介绍了Oracle数据库的三种客户端工具:SQL*Plus、Oracle Enterprise Manager Database Express(EM)和SQL Developer的使用方法。首先通过命令行工具SQL*Plus登录数据库,创建用户并授权,建立部门与员工表,插入数据并查询;接着讲解了如何通过浏览器访问EM界面监控数据库及表空间状态;最后演示了SQL Developer的下载安装、连接配置以及执行查询的过程,帮助用户快速上手Oracle数据库管理与操作。
数据库数据恢复—ORACLE常见故障的数据恢复方案
Oracle数据库常见故障表现: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE ASM存储破坏。 3、ORACLE数据文件丢失。 4、ORACLE数据文件部分损坏。 5、ORACLE DUMP文件损坏。
201 11
Oracle数据恢复—Oracle数据库文件有坏快损坏的数据恢复案例
一台Oracle数据库打开报错,报错信息: “system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。管理员联系我们数据恢复中心寻求帮助,并提供了Oracle_Home目录的所有文件。用户方要求恢复zxfg用户下的数据。 由于数据库没有备份,无法通过备份去恢复数据库。
oracle数据恢复—Oracle数据库文件大小变为0kb的数据恢复案例
存储掉盘超过上限,lun无法识别。管理员重组存储的位图信息并导出lun,发现linux操作系统上部署的oracle数据库中有上百个数据文件的大小变为0kb。数据库的大小缩水了80%以上。 取出&并分析oracle数据库的控制文件。重组存储位图信息,重新导出控制文件中记录的数据文件,发现这些文件的大小依然为0kb。

热门文章

最新文章

推荐镜像

更多