AIX 5.3下Oracle 10g RAC 启动故障--vip漂移

简介:

系统环境:

操作系统: AIX 5300-09

集群软件: CRS 10.2.0.1

数据库:   Oracle 10.2.0.1

系统架构图


wKioL1NspizDELFmAAFqCT5td6k065.jpg


故障现象:

系统重启后,在节点上CRS 启动失败或CRS服务启动成功,CRS Resource无法ONLINE。

[root@aix213 racg] cat /etc/hosts

1
2
3
4
5
6
7
8
127.0 . 0.1                loopback localhost      # loopback (lo0) name/address
192.168 . 8.214    aix214
192.168 . 8.106    aix106
192.168 . 8.213    aix213
192.168 . 8.115    aix213-vip
10.10 . 10.213     aix213-priv
192.168 . 8.113    aix214-vip
10.10 . 10.214     aix214-priv

每个node都绑定了其他节点的vip ip ,vip ip address 绑定到了所有的节点上!

[oracle@aix214 ~]$ifconfig -a

1
2
3
4
5
en0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
        inet  192.168 . 8.214  netmask  0xffffff00  broadcast  192.168 . 8.255
inet  192.168 . 8.113  netmask  0xffffff00  broadcast  192.168 . 8.255
         inet  192.168 . 8.115  netmask  0xffffff00  broadcast  192.168 . 8.255
         tcp_sendspace  131072  tcp_recvspace  65536  rfc1323  0

[oracle@aix213 ~]$ifconfig -a

1
2
3
4
5
en0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
        inet  192.168 . 8.213  netmask  0xffffff00  broadcast  192.168 . 8.255
   inet  192.168 . 8.113  netmask  0xffffff00  broadcast  192.168 . 8.255
         inet  192.168 . 8.115  netmask  0xffffff00  broadcast  192.168 . 8.255
         tcp_sendspace  131072  tcp_recvspace  65536  rfc1323  0

[root@aix214 /]$crsctl check crs

1
2
3
CSS appears healthy
CRS appears healthy
EVM appears healthy

[root@aix214 /]$crs_stat -t

1
2
3
4
5
6
7
8
9
10
11
12
13
Name           Type           Target    State     Host        
------------------------------------------------------------
ora... .13. lsnr application    ONLINE    OFFLINE
ora.aix213.gsd application    ONLINE    OFFLINE
ora.aix213.ons application    ONLINE    OFFLINE               
ora.aix213.vip application    ONLINE    OFFLINE               
ora... .14. lsnr application    ONLINE    OFFLINE               
ora.aix214.gsd application    ONLINE    OFFLINE               
ora.aix214.ons application    ONLINE    OFFLINE               
ora.aix214.vip application    ONLINE    OFFLINE               
ora.prod.db    application    ONLINE    OFFLINE               
ora....d1.inst application    ONLINE    OFFLINE               
ora....d2.inst application    ONLINE    OFFLINE

查看日志

[root@aix213 racg]cd /u01/crs_1/log/aix213/racg

1
2
3
4
5
6
7
8
9
10
11
12
13
[root @aix213  racg]$more ora.aix213.vip.log
Oracle Database 10g CRS Release  10.2 . 0.1 . 0  Production Copyright  1996 2005  Oracle.  All rig
hts reserved.
2014 - 05 - 09  17 : 07 : 05.624 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: Invalid parameters, or 
failed to bring up VIP (host=aix213)
2014 - 05 - 09  17 : 07 : 05.624 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: clsrcexecut: env ORACLE
_CONFIG_HOME=/u01/crs_1
2014 - 05 - 09  17 : 07 : 05.625 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: clsrcexecut: cmd = /u01
/crs_1/bin/racgeut -e _USR_ORA_DEBUG= 0  54  /u01/crs_1/bin/racgvip start aix213
2014 - 05 - 09  17 : 07 : 05.625 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: clsrcexecut: rc =  1 , ti
me =  0 .345s
2014 - 05 - 09  17 : 07 : 06.832 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: Invalid parameters, or 
failed to bring up VIP (host=aix213)

......

初步判断是在节点上VIP配置有问题

解决方法1:

1、关闭所有node上的nodeapps

[oracle@aix213 ~]$srvctl stop nodeapps -n  aix213

[oracle@aix213 ~]$srvctl stop nodeapps -n  aix214

[oracle@aix213 ~]$srvctl modify nodeapps  -A 192.168.8.115/255.255.255.0/en0 -n aix213 -o $ORACLE_HOME

[oracle@aix213 ~]$srvctl modify nodeapps  -A 192.168.8.113/255.255.255.0/en0 -n aix214 -o $ORACLE_HOME

2、停止所有节点的crs

[oracle@aix213 ~]$crsctl stop  crs

[oracle@aix214 ~]$crsctl stop crs

3、重新启动所有节点的crs

[oracle@aix213 ~]$crsctl start  crs

[oracle@aix214 ~]$crsctl start crs

解决方法2:

1、更新CRS中VIP信息

[root@aix213 racg] cat /etc/hosts

1
2
3
4
5
6
7
8
127.0 . 0.1                loopback localhost      # loopback (lo0) name/address
192.168 . 8.214    aix214
192.168 . 8.106    aix106
192.168 . 8.213    aix213
192.168 . 8.115    aix213-vip
10.10 . 10.213     aix213-priv
192.168 . 8.113    aix214-vip
10.10 . 10.214     aix214-priv

2、修改VIP

1
2
3
[root @aix214  /]$srvctl modify nodeapps -n aix213 -o /u01/app/oracle/product/ 10.2 . 0 /db_1/ -A  192.168 . 8.115 / 255.255 . 255.0 /en0
 
[root @aix214  /]$srvctl modify nodeapps -n aix214 -o /u01/app/oracle/product/ 10.2 . 0 /db_1/ -A  192.168 . 8.113 / 255.255 . 255.0 /en0

3、以root身份执行vipca

wKioL1NsqdfwzjktABaoQqgmyBY106.jpg


4、重新启动CRS服务

1
2
3
4
[root @aix214  /]$crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy

[root@aix214 /]$crs_stat -t

1
2
3
4
5
6
7
8
9
10
11
12
13
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.... 13 .lsnr application    OFFLINE   OFFLINE               
ora.aix213.gsd application    ONLINE    ONLINE    aix213      
ora.aix213.ons application    ONLINE    ONLINE    aix213      
ora.aix213.vip application    ONLINE    ONLINE    aix213      
ora.... 14 .lsnr application    ONLINE    OFFLINE               
ora.aix214.gsd application    ONLINE    ONLINE    aix214      
ora.aix214.ons application    ONLINE    ONLINE    aix214      
ora.aix214.vip application    ONLINE    ONLINE    aix214      
ora.prod.db    application    ONLINE    OFFLINE               
ora....d1.inst application    OFFLINE   OFFLINE               
ora....d2.inst application    ONLINE    OFFLINE

手工启动Listener service:

1
2
3
4
5
6
7
8
9
10
11
[root @aix214  /]$crs_stat |grep lsn
NAME=ora.aix213.LISTENER_AIX213.lsnr
NAME=ora.aix214.LISTENER_AIX214.lsnr
 
[root @aix214  /]$crs_start -f ora.aix214.LISTENER_AIX214.lsnr
Attempting to start `ora.aix214.LISTENER_AIX214.lsnr` on member `aix214`
Start of `ora.aix214.LISTENER_AIX214.lsnr` on member `aix214` succeeded.
 
[root @aix214  /]$crs_start -f ora.aix213.LISTENER_AIX213.lsnr
Attempting to start `ora.aix213.LISTENER_AIX213.lsnr` on member `aix213`
Start of `ora.aix213.LISTENER_AIX213.lsnr` on member `aix213` succeeded.

至此CRS启动成功:

[oracle@aix213 ~]$crs_stat -t

1
2
3
4
5
6
7
8
9
10
11
12
13
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.... 13 .lsnr application    ONLINE    ONLINE    aix213      
ora.aix213.gsd application    ONLINE    ONLINE    aix213      
ora.aix213.ons application    ONLINE    ONLINE    aix213      
ora.aix213.vip application    ONLINE    ONLINE    aix213      
ora.... 14 .lsnr application    ONLINE    ONLINE    aix214      
ora.aix214.gsd application    ONLINE    ONLINE    aix214      
ora.aix214.ons application    ONLINE    ONLINE    aix214      
ora.aix214.vip application    ONLINE    ONLINE    aix214      
ora.prod.db    application    ONLINE    ONLINE    aix213      
ora....d1.inst application    ONLINE    ONLINE    aix213      
ora....d2.inst application    ONLINE    ONLINE    aix214

@至此,问题基本解决










本文转自 客居天涯 51CTO博客,原文链接:http://blog.51cto.com/tiany/1408998,如需转载请自行联系原作者
目录
相关文章
|
1月前
|
存储 Oracle 关系型数据库
数据库数据恢复—ORACLE常见故障的数据恢复方案
Oracle数据库常见故障表现: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE ASM存储破坏。 3、ORACLE数据文件丢失。 4、ORACLE数据文件部分损坏。 5、ORACLE DUMP文件损坏。
122 11
|
3月前
|
存储 Oracle 关系型数据库
数据库数据恢复—Oracle ASM磁盘组故障数据恢复案例
Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能mount。 Oracle数据库故障分析&恢复方案: 数据库数据恢复工程师对组成ASM磁盘组的磁盘进行分析。对ASM元数据进行分析发现ASM存储元数据损坏,导致磁盘组无法挂载。
|
5月前
|
运维 Oracle 前端开发
Oracle 11g RAC集群日常运维命令总结
Oracle 11g RAC集群日常运维命令总结
124 2
|
5月前
|
Oracle 关系型数据库
分布式锁设计问题之Oracle RAC保证多个节点写入内存Page的一致性如何解决
分布式锁设计问题之Oracle RAC保证多个节点写入内存Page的一致性如何解决
|
6月前
|
存储 负载均衡 Oracle
|
6月前
|
Oracle 关系型数据库 数据库
关系型数据库Oracle 故障转移能力
【7月更文挑战第10天】
76 2
|
6月前
|
存储 Oracle 关系型数据库
|
8月前
|
存储 Oracle 关系型数据库
Oracle RAC:数据库集群的舞动乐章
【4月更文挑战第19天】Oracle RAC是Oracle提供的高可用性数据库解决方案,允许多个实例共享同一数据库,确保业务连续性和数据完整性。通过集群件和全局缓存服务实现服务器间的协调和通信。RAC提供高可用性,通过故障转移应对故障,同时提升性能,多个实例并行处理请求。作为数据管理员,理解RAC的架构和管理至关重要,以发挥其在数据管理中的最大价值。
|
8月前
|
Oracle 关系型数据库
oracle rac 手工安装补丁,不适用auto
oracle rac 手工安装补丁,不适用auto
92 3

推荐镜像

更多