AIX 5.3 Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

简介:

系统环境:

操作系统: AIX 5300-09

集群软件: CRS 10.2.0.1

数据库:   Oracle 10.2.0.1


                     系统架构图


wKioL1NrS-bRgWeoAAFqCT5td6k189.jpg

                                       本机采用vg 并发(VG concurrent)作为共享的存储

故障现象:

wKioL1NrTRiSiP7DAAEUCn2pgac229.jpg

当在第一个node(aix211)执行root.sh时,被hang住......

查看日志:

[root@aix211 soft]#cd /u01/crs_1/log

[root@aix211 aix211]#ls

admin            client           cssd             racg

alertaix211.log  crsd             evmd

[root@aix211 aix211]#cd client/

[root@aix211 client]#ls

ocrconfig_458796.log  ocrconfig_471234.log

[root@aix211 client]#ls -lt

total 24

-rw-r-----    1 root     system          681 May  8 14:57 ocrconfig_458796.log

-rw-r-----    1 root     system         5684 May  8 14:54 ocrconfig_471234.log

[root@aix211 client]#tail -f ocrconfig_458796.log

Oracle Database 10g CRS Release 10.2.0.1.0 Production Copyright 1996, 2005 Oracle.  All rights reserved.

2014-05-08 14:56:08.858: [ OCRCONF][1]ocrconfig starts...

2014-05-08 14:56:08.860: [ OCRCONF][1]Upgrading OCR data

2014-05-08 14:56:27.280: [  OCROSD][1]utread:3: problem reading buffer 100e09f0 buflen 512 retval -1 phy_offset 102400 retry 0

2014-05-08 14:56:27.280: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:03.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1024 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:03.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:39.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1536 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:39.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

出现磁盘的I/O故障!


解决方法:

1、查看PV和VG

[root@aix211 client]#lspv

hdisk0          00040f8aaa29d28e                    rootvg          active

hdisk1          000e1a6ce663b4af                    racvg           concurrent

[root@aix211 client]#lsvg racvg

--查看VG时也 hang 住......看来是共享卷组的磁盘出现了故障,因为是个实验环境,阵列不很稳定,重启系统......


2、重启系统后,重新执行root.sh

3、手工执行安装后校验

[oracle@aix211 ~]$cd /u01/soft/Disk1(CRS 安装盘)

[oracle@aix211 Disk1]$ls

cluvfy        install       response      rootpre       runInstaller  stage         upgrade

[oracle@aix211 Disk1]$cd cluvfy/

[oracle@aix211 cluvfy]$ls

bin           cv            cvupack.zip   jlib          jrepack.zip   lib           lib32         runcluvfy.sh

[oracle@aix211 cluvfy]$./runcluvfy.sh -help

USAGE:

cluvfy [ -help ]

cluvfy stage { -list | -help }

cluvfy stage {-pre|-post} <stage-name> <stage-specific options>  [-verbose]

cluvfy comp  { -list | -help }

cluvfy comp  <component-name> <component-specific options>  [-verbose]


[oracle@aix211 cluvfy]$./runcluvfy.sh stage -post crsinst -n aix211,aix212 -verbose

Performing post-checks for cluster services setup

Checking node reachability...

Check: Node reachability from node "aix211"

 Destination Node                      Reachable?              

 ------------------------------------  ------------------------

 aix211                                yes                    

 aix212                                yes                    

Result: Node reachability check passed from node "aix211".

Checking user equivalence...

Check: User equivalence for user "oracle"

 Node Name                             Comment                

 ------------------------------------  ------------------------

 aix212                                passed                  

 aix211                                passed                  

Result: User equivalence check passed for user "oracle".


Checking Cluster manager integrity...

Checking CSS daemon...

 Node Name                             Status                  

 ------------------------------------  ------------------------

 aix212                                running                

 aix211                                running                

Result: Daemon status check passed for "CSS daemon".

Cluster manager integrity check passed.

Checking cluster integrity...

 Node Name                          

 ------------------------------------

 aix211                              

 aix212                              

Cluster integrity check passed

Checking OCR integrity...

Checking the absence of a non-clustered configuration...

All nodes free of non-clustered, local-only configurations.

Uniqueness check for OCR device passed.

Checking the version of OCR...

OCR of correct Version "2" exists.

Checking data integrity of OCR...

Data integrity check for OCR passed.

OCR integrity check passed.

Checking CRS integrity...

Checking daemon liveness...

Check: Liveness for "CRS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CRS daemon".

Checking daemon liveness...

Check: Liveness for "CSS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CSS daemon".

Checking daemon liveness...

Check: Liveness for "EVM daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "EVM daemon".

Liveness of all the daemons

 Node Name     CRS daemon                CSS daemon                EVM daemon

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       yes                       yes      

 aix211        yes                       yes                       yes      

Checking CRS health...

Check: Health of CRS

 Node Name                             CRS OK?                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: CRS health check passed.

CRS integrity check passed.

Checking node application existence...

Checking existence of VIP node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       exists                    passed    

 aix211        yes                       exists                    passed    

Result: Check passed.

Checking existence of ONS node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Checking existence of GSD node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Post-check for cluster services setup was successful.

[oracle@aix211 cluvfy]$

@至此,CRS安装成功,问题解决!










本文转自 客居天涯 51CTO博客,原文链接:http://blog.51cto.com/tiany/1408511,如需转载请自行联系原作者
目录
相关文章
|
16天前
|
存储 Oracle 关系型数据库
数据库数据恢复—ORACLE常见故障的数据恢复方案
Oracle数据库常见故障表现: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE ASM存储破坏。 3、ORACLE数据文件丢失。 4、ORACLE数据文件部分损坏。 5、ORACLE DUMP文件损坏。
62 11
|
2月前
|
存储 Oracle 关系型数据库
数据库数据恢复—Oracle ASM磁盘组故障数据恢复案例
Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能mount。 Oracle数据库故障分析&恢复方案: 数据库数据恢复工程师对组成ASM磁盘组的磁盘进行分析。对ASM元数据进行分析发现ASM存储元数据损坏,导致磁盘组无法挂载。
|
4月前
|
运维 Oracle 前端开发
Oracle 11g RAC集群日常运维命令总结
Oracle 11g RAC集群日常运维命令总结
112 2
|
4月前
|
Oracle 关系型数据库
分布式锁设计问题之Oracle RAC保证多个节点写入内存Page的一致性如何解决
分布式锁设计问题之Oracle RAC保证多个节点写入内存Page的一致性如何解决
|
5月前
|
存储 负载均衡 Oracle
|
5月前
|
Oracle 关系型数据库 数据库
关系型数据库Oracle 故障转移能力
【7月更文挑战第10天】
67 2
|
5月前
|
存储 Oracle 关系型数据库
|
7月前
|
SQL Oracle Unix
Oracle sqlplus failed on AIX platform(/usr/lib/lib
Oracle sqlplus failed on AIX platform(/usr/lib/lib
43 1
|
7月前
|
Oracle 关系型数据库 Unix
Install ORACLE10g On AIX5L 5.2(转自LU)
Install ORACLE10g On AIX5L 5.2(转自LU)
49 1