【Oracle】数据库hang 诊断

简介: 一 什么是数据库hang 1 用户不能登录数据库2 数据库不能正常工作3 select 1 from dual 不出结果4 不能正常完成建表操作二 数据库被锁住   1  一个或多个会话停止工作三 如果得知数据库hang 或者被锁   1 测试...
一 什么是数据库hang 
1 用户不能登录数据库
2 数据库不能正常工作
3 select 1 from dual 不出结果
4 不能正常完成建表操作

二 数据库被锁住
   1  一个或多个会话停止工作
三 如果得知数据库hang 或者被锁
   1 测试
   2 用户抱怨
   3 systemstate 或者hanganalze 操作查看被阻塞的会话
   4 一个查询hang 住不动
   5 会话耗费了大量的cpu
   6 ora-60 错误出现
四  上述现象可能会在以下操作之后:
   1 schema 变动
   2 数据库参数变动
   3 应用程序的改动
   4 数据库升级
五  理清 issue 发生的状况,你必须了解如下
   1 受影响的用户
   2 导致问题的事件的发生的顺序
   3 问题是从哪里/如何被发现的
   4 问题的表现
   5 什么正在工作
   6 最希望的或者最能够接受的结果是什么
   7 你做了什么操作来解决这个问题
六 验证工作 
   必须对数据库是否hang 或者lock 进行验证 否则会导致采取错误的动作。也有可能是os 的性能问题导致数据库表现为hang 住的!!
   select 1 from dual;

七 收集数据
  1 使用 LTOM 收集数据
  2 使用 OSW 收集系统性能数据
  3 使用 EM 

八 使用hanganalyze 和systemstate 收集数据
  DUMP进程状态可以使用: 
    alter sessions set events 'immediate trace name processstate level ';
  或者使用:
    oradebug setmypid
    oradebug ulimit
    oradebug dump processstate
当诊断数据库挂起时,可以使用DUMP命令转储整个系统状态:
alter sessions set events 'immediate trace name systemstate level ';
或:
oradebug setmypid
oradebug ulimit
oradebug dump systemstate
如果为了获取全面一点的信息,可以使用Level 10。
SQL> oradebug setmypid
SQL> oradebug unlimit
SQL> oradebug dump systemstate 10
另外如果系统挂起,无法用SQL*Plus连接,从Oracle 10g开始,可以使用sqlplus -prelim选项强制登录,然后即可进行系统状态信息转储:
sqlplus -prelim '/ as sysdba'
oradebug setmypid
oradebug unlimit;
oradebug dump systemstate 10
====================================
--for 单实例
SQL>ORADEBUG hanganalyze
--for RAC 实例
SQL>ORADEBUG setmypid
SQL>ORADEBUG setinst all
SQL>ORADEBUG -g def hanganalyze  
注意:如果Level过大的话会产生大量的跟踪文件并影响系统的I/O性能,Oracle建议不要采用3级以上的跟踪。
以sysdba 登录
oradebug setmypid
oradebug unlimit
oradebug -g  all hanganalyze 3
oradebug -g all dump systemstate 266
--等待2min
oradebug -g  all hanganalyze 3
oradebug -g all dump systemstate 266

默认搜集数据的步骤如下:
1 hanhanalyze  level 3
2 systemstate level 266
3 wait 60 sec
4 hanhanalyze  level 3
5 systemstate level 266

对于单实例 trace file 文件在 本地的user_dump_desttination 
对于rac 环境 trace file 文件在每个节点的 backgroup_dump_destination

九 获取v$性能数据
SPOOL v_views.log;

/*set linesize 130
col "Parameter" form. a50
col "Session Value" form. a30
col "Instance Value" form. a30
*/
select a.ksppinm  "Parameter",
       b.ksppstvl "Session Value",
       c.ksppstvl "Instance Value"
  from x$ksppi a, x$ksppcv b, x$ksppsv c
  where a.indx = b.indx
   and a.indx = c.indx
  order by 1 ;

SELECT class valuename FROM v$sysstat;

SELECT sid , id1, id2, type, lmode, request FROM v$lock;

SELECT l.latch#,
       n.name,
       h.pid,
       l.gets,
       l.misses,
       l.immediate_gets,
       l.immediate_misses,
       l.sleeps
  FROM v$latchname n, v$latchholder h, v$latch l
  WHERE l.latch# = n.latch#
   AND l.addr = h.laddr(+);

SELECT * FROM v$session_wait ORDER BY sid ;
/* repeat last query 3 times - we want to see who's repeatedly waiting*/
SPOOL OFF;

获取了数据之后 就是分析了!!

目录
相关文章
|
1月前
|
数据采集 Oracle 关系型数据库
实时计算 Flink版产品使用问题之怎么实现从Oracle数据库读取多个表并将数据写入到Iceberg表
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
2天前
|
Oracle 关系型数据库 数据库
数据库数据恢复—Oracle数据库文件出现坏块的数据恢复案例
打开oracle数据库报错“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。 数据库没有备份,无法通过备份去恢复数据库。用户方联系北亚企安数据恢复中心并提供Oracle_Home目录中的所有文件,急需恢复zxfg用户下的数据。 出现“system01.dbf需要更多的恢复来保持一致性”这个报错的原因可能是控制文件损坏、数据文件损坏,数据文件与控制文件的SCN不一致等。数据库恢复工程师对数据库文件进一步检测、分析后,发现sysaux01.dbf文件损坏,有坏块。 修复并启动数据库后仍然有许多查询报错,export和data pump工具使用报错。从数据库层面无法修复数据库。
数据库数据恢复—Oracle数据库文件出现坏块的数据恢复案例
|
9天前
|
Oracle 安全 关系型数据库
Oracle数据恢复—Oracle数据库误删除的数据恢复方法探讨
删除Oracle数据库数据一般有以下2种方式:delete、drop或truncate。下面针对这2种删除oracle数据库数据的方式探讨一下oracle数据库数据恢复方法(不考虑全库备份和利用归档日志)。
|
20天前
|
存储 Oracle 关系型数据库
Oracle同一台服务器创建多个数据库
【8月更文挑战第30天】在 Oracle 中,可在同一服务器上创建多个数据库。首先确保已安装 Oracle 软件并具有足够资源,然后使用 DBCA 工具按步骤创建,包括选择模板、配置存储及字符集等。重复此过程可创建多个数据库,需确保名称、SID 和存储位置唯一。创建后,可通过 Oracle Enterprise Manager 进行管理,注意服务器资源分配与规划。
34 10
|
28天前
|
存储 Oracle 关系型数据库
分享几个Oracle数据库日常维护中常见的问题
分享几个Oracle数据库日常维护中常见的问题
74 1
|
22天前
|
SQL Oracle 关系型数据库
实时计算 Flink版产品使用问题之Oracle数据库是集群部署的,怎么进行数据同步
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
28天前
|
Oracle 关系型数据库 数据库
Oracle数据库备份脚本分享-Python
Oracle数据库备份脚本分享-Python
24 0
|
1月前
|
存储 自然语言处理 Oracle
Oracle数据库字符集概述及修改方式
【8月更文挑战第15天】Oracle 数据库字符集定义了数据的编码方案,决定可存储的字符类型及其表示方式。主要作用包括数据存储、检索及跨系统传输时的正确表示。常见字符集如 AL32UTF8 支持多语言,而 WE8MSWIN1252 主用于西欧语言。修改字符集风险高,可能导致数据问题,需事先备份并评估兼容性。可通过 ALTER DATABASE 语句直接修改或采用导出-导入数据的方式进行。完成后应验证数据完整性。此操作复杂,须谨慎处理。
|
1月前
|
SQL Oracle 关系型数据库
"揭秘!一键解锁Oracle日志清理魔法,让海量归档日志无处遁形,守护数据库健康,告别磁盘空间告急噩梦!"
【8月更文挑战第9天】随着Oracle数据库在企业应用中的普及,归档日志管理对保持数据库健康至关重要。归档日志记录所有更改,对数据恢复极为重要,但也可能迅速占用大量磁盘空间影响性能。利用Oracle提供的RMAN工具,可通过编写Shell脚本来自动清理归档日志。脚本包括设置环境变量、连接数据库、检查和删除指定时间前的日志,并记录执行情况。通过Cron作业定时运行脚本,可有效管理日志文件,确保数据库稳定运行。
66 7
|
1月前
|
Oracle 关系型数据库 MySQL
Mysql和Oracle数据库死锁查看以及解决
【8月更文挑战第11天】本文介绍了解决MySQL与Oracle数据库死锁的方法。MySQL可通过`SHOW ENGINE INNODB STATUS`查看死锁详情,并自动回滚一个事务解除死锁;也可手动KILL事务。Oracle则通过查询V$LOCK与V$SESSION视图定位死锁,并用`ALTER SYSTEM KILL SESSION`命令终止相关会话。预防措施包括遵循ACID原则、优化索引及拆分大型事务。

推荐镜像

更多