AIX 5.3 Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

简介:

系统环境:

操作系统: AIX 5300-09

集群软件: CRS 10.2.0.1

数据库:   Oracle 10.2.0.1


                     系统架构图


wKioL1NrS-bRgWeoAAFqCT5td6k189.jpg

                                       本机采用vg 并发(VG concurrent)作为共享的存储

故障现象:

wKioL1NrTRiSiP7DAAEUCn2pgac229.jpg

当在第一个node(aix211)执行root.sh时,被hang住......

查看日志:

[root@aix211 soft]#cd /u01/crs_1/log

[root@aix211 aix211]#ls

admin            client           cssd             racg

alertaix211.log  crsd             evmd

[root@aix211 aix211]#cd client/

[root@aix211 client]#ls

ocrconfig_458796.log  ocrconfig_471234.log

[root@aix211 client]#ls -lt

total 24

-rw-r-----    1 root     system          681 May  8 14:57 ocrconfig_458796.log

-rw-r-----    1 root     system         5684 May  8 14:54 ocrconfig_471234.log

[root@aix211 client]#tail -f ocrconfig_458796.log

Oracle Database 10g CRS Release 10.2.0.1.0 Production Copyright 1996, 2005 Oracle.  All rights reserved.

2014-05-08 14:56:08.858: [ OCRCONF][1]ocrconfig starts...

2014-05-08 14:56:08.860: [ OCRCONF][1]Upgrading OCR data

2014-05-08 14:56:27.280: [  OCROSD][1]utread:3: problem reading buffer 100e09f0 buflen 512 retval -1 phy_offset 102400 retry 0

2014-05-08 14:56:27.280: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:03.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1024 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:03.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:39.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1536 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:39.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

出现磁盘的I/O故障!


解决方法:

1、查看PV和VG

[root@aix211 client]#lspv

hdisk0          00040f8aaa29d28e                    rootvg          active

hdisk1          000e1a6ce663b4af                    racvg           concurrent

[root@aix211 client]#lsvg racvg

--查看VG时也 hang 住......看来是共享卷组的磁盘出现了故障,因为是个实验环境,阵列不很稳定,重启系统......


2、重启系统后,重新执行root.sh

3、手工执行安装后校验

[oracle@aix211 ~]$cd /u01/soft/Disk1(CRS 安装盘)

[oracle@aix211 Disk1]$ls

cluvfy        install       response      rootpre       runInstaller  stage         upgrade

[oracle@aix211 Disk1]$cd cluvfy/

[oracle@aix211 cluvfy]$ls

bin           cv            cvupack.zip   jlib          jrepack.zip   lib           lib32         runcluvfy.sh

[oracle@aix211 cluvfy]$./runcluvfy.sh -help

USAGE:

cluvfy [ -help ]

cluvfy stage { -list | -help }

cluvfy stage {-pre|-post} <stage-name> <stage-specific options>  [-verbose]

cluvfy comp  { -list | -help }

cluvfy comp  <component-name> <component-specific options>  [-verbose]


[oracle@aix211 cluvfy]$./runcluvfy.sh stage -post crsinst -n aix211,aix212 -verbose

Performing post-checks for cluster services setup

Checking node reachability...

Check: Node reachability from node "aix211"

 Destination Node                      Reachable?              

 ------------------------------------  ------------------------

 aix211                                yes                    

 aix212                                yes                    

Result: Node reachability check passed from node "aix211".

Checking user equivalence...

Check: User equivalence for user "oracle"

 Node Name                             Comment                

 ------------------------------------  ------------------------

 aix212                                passed                  

 aix211                                passed                  

Result: User equivalence check passed for user "oracle".


Checking Cluster manager integrity...

Checking CSS daemon...

 Node Name                             Status                  

 ------------------------------------  ------------------------

 aix212                                running                

 aix211                                running                

Result: Daemon status check passed for "CSS daemon".

Cluster manager integrity check passed.

Checking cluster integrity...

 Node Name                          

 ------------------------------------

 aix211                              

 aix212                              

Cluster integrity check passed

Checking OCR integrity...

Checking the absence of a non-clustered configuration...

All nodes free of non-clustered, local-only configurations.

Uniqueness check for OCR device passed.

Checking the version of OCR...

OCR of correct Version "2" exists.

Checking data integrity of OCR...

Data integrity check for OCR passed.

OCR integrity check passed.

Checking CRS integrity...

Checking daemon liveness...

Check: Liveness for "CRS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CRS daemon".

Checking daemon liveness...

Check: Liveness for "CSS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CSS daemon".

Checking daemon liveness...

Check: Liveness for "EVM daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "EVM daemon".

Liveness of all the daemons

 Node Name     CRS daemon                CSS daemon                EVM daemon

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       yes                       yes      

 aix211        yes                       yes                       yes      

Checking CRS health...

Check: Health of CRS

 Node Name                             CRS OK?                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: CRS health check passed.

CRS integrity check passed.

Checking node application existence...

Checking existence of VIP node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       exists                    passed    

 aix211        yes                       exists                    passed    

Result: Check passed.

Checking existence of ONS node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Checking existence of GSD node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Post-check for cluster services setup was successful.

[oracle@aix211 cluvfy]$

@至此,CRS安装成功,问题解决!










本文转自 客居天涯 51CTO博客,原文链接:http://blog.51cto.com/tiany/1408511,如需转载请自行联系原作者
目录
相关文章
|
6月前
|
Oracle 关系型数据库
oracle asm 磁盘显示offline
oracle asm 磁盘显示offline
316 2
|
17天前
|
存储 Oracle 关系型数据库
数据库数据恢复—Oracle ASM磁盘组故障数据恢复案例
Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能mount。 Oracle数据库故障分析&恢复方案: 数据库数据恢复工程师对组成ASM磁盘组的磁盘进行分析。对ASM元数据进行分析发现ASM存储元数据损坏,导致磁盘组无法挂载。
|
4月前
|
Oracle 关系型数据库 数据库
关系型数据库Oracle 故障转移能力
【7月更文挑战第10天】
51 2
|
6月前
|
SQL Oracle Unix
Oracle sqlplus failed on AIX platform(/usr/lib/lib
Oracle sqlplus failed on AIX platform(/usr/lib/lib
34 1
|
6月前
|
Oracle 关系型数据库 Unix
Install ORACLE10g On AIX5L 5.2(转自LU)
Install ORACLE10g On AIX5L 5.2(转自LU)
41 1
|
6月前
|
存储 Oracle 关系型数据库
【数据库数据恢复】Oracle数据库ASM磁盘组掉线的数据恢复案例
oracle数据库ASM磁盘组掉线,ASM实例不能挂载。数据库管理员尝试修复数据库,但是没有成功。
【数据库数据恢复】Oracle数据库ASM磁盘组掉线的数据恢复案例
|
6月前
|
运维 Oracle 关系型数据库
服务器数据恢复-raid5故障导致上层oracle数据库故障的数据恢复案例
服务器数据恢复环境: 一台服务器中有一组由24块FC硬盘组建的raid5磁盘阵列,linux操作系统+ext3文件系统,服务器上层部署有oracle数据库。 服务器故障&检测: raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正常使用。 通过管理后台查看服务器中硬盘的状态,显示有两块硬盘处于离线状态。
|
存储 Oracle 算法
数据库数据恢复-ORACLE数据库常见故障的数据恢复可能性分析
ORACLE数据库常见故障: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE数据库ASM存储破坏。 3、ORACLE数据库数据文件丢失。 4、ORACLE数据库数据文件部分损坏。 5、ORACLE数据库DUMP文件损坏。
|
Oracle 关系型数据库 网络安全
连接Oracle数据库失败(ORA-12514)故障排除
ORA-12514的故障是很多新手在连接Oracle数据库时经常遇到故障,它通常表示无法连接到数据库实例,这里姚远老师告诉大家如何排除这类故障。
9305 0
|
存储 SQL 负载均衡
Oracle实现高可用性的工具(负载均衡/故障切换)
Oracle实现高可用性的工具(负载均衡/故障切换)
237 0