latch: undo global data问题的处理

简介:

五一假期期间接到运维同学的微信,说应用报错了,跟数据库有关的,发过来截图一看报错的信息是could not get next sequence value。以为是某个sequence达到了最大值,让帮忙查是哪个sequence。

于是查了dba_sequences,没有哪个sequence达到了最大值。

于是看session的信息,查询v$session中的等待事件,发现有大量的等待事件是“latch: undo global data”。从事件名字上来看应该是undo的问题。

查询undo表空间的使用率,果然到了100%。但undo是可以重复使用的,除非有非常大的事务占满了整个undo表空间,undo表空间有460多G,占满的可能性不大。

上网搜了latch: undo global data相关的文章,有一个提到MOS上的一篇文档:"LATCH: UNDO GLOBAL DATA" In The Top Wait Events (文档 ID 1451536.1)

文档中介绍这个等待事件意味着大量的session在试图找到新的undo extent和偷取未过期的undo extents。这个等待和隐含参数_undo_autotune设置为FALSE情况下的UNDO空间不足有关。

当前数据库的_undo_autotune确实为FALSE,而且undo_retention=259200,换算下来就是72小时。

先认识一下隐含参数_undo_autotune:

      从10.2版本开始,oracle默认采用自动调整undo retention的方法

      根据你undo tablespace的大小以及系统的繁忙程度(v$undostat中信息)自动调整undo_retention参数,所以在10g的数据库上你会经常发现undo tablespace永远是满的,因为当你undo tablespace有空闲空间时,系统自动调大undo_retention来保留更多的undo blocks。这一方法有利于时间长的查询,但是对于典型的OLTP系统来说不太适用。因为OLTP上不太可能跑如此长时间的查询,而且在很繁忙的 OLTP上还会导致上面所遇到的问题。

_undo_autotune=true时,undo_retention不再适用。而_undo_autotune=false时,undo_retention按设置的时间保留。

通过上面的解释,再加上五一假期期间在做数据清理工作,大量的undo被保留72小时,最终导致了undo表空间爆满,应用无法正常访问。

解决方法:

1、设置_undo_autotune=true,可以在线修改

2、增加undo表空间大小(resize现有数据文件或增加数据文件)

3、调小undo_retention参数

最终调小了undo_retention参数设置为43200(12小时),应用恢复正常。


参考:http://blog.itpub.net/4227/viewspace-1060723/

http://blog.csdn.net/dba_waterbin/article/details/8646982






      本文转自hbxztc 51CTO博客,原文链接:http://blog.51cto.com/hbxztc/1922747,如需转载请自行联系原作者

相关文章
|
存储 SQL 缓存
【MySQL】change buffer,buffer pool,redo log,bin log,undo log的作用
【MySQL】change buffer,buffer pool,redo log,bin log,undo log的作用
165 0
|
SQL 关系型数据库 MySQL
|
存储 SQL 缓存
InnoDB之UNDO LOG介绍
undo log是InnoDB事务特性的重要组成部分。当对记录做增删改操作就会产生undo记录,undo记录会记录到单独的表空间中。 本文将从代码层面对undo log进行一个简单的介绍;主要从下面四个方面来介绍undo log:undo log组织形式与分配与记录,以及undo log的应用及其清理。从这四个方面出发,我们就可以基本了解undo log的整个生命周期。
730 1
|
存储 SQL 关系型数据库
mysql大量的waiting for table level lock怎么办
mysql大量的waiting for table level lock怎么办
298 0
|
关系型数据库
InnoDB redo log thread cpu usage
InnoDB 在8.0 里面把写redo log 角色的各个线程都独立出来, 每一个thread 都处于wait 状态, 同样用户thread 调用log_write_up_to 以后, 也会进入wait 状态.这里的wait 等待最后都是通过调用 os_event_wait_for 来实现, 而 os_event_wait_for 是先spin + wait 的方式实现.所以这里有两个参数会影响os_event_wait_for 函数:spins_limit,timeout.
163 0
|
NoSQL 关系型数据库 MySQL
如何查找到底是谁执行了FTWL导致Waiting for global read lock
在MySQL · 特性分析 · 到底是谁执行了FTWL中 文章中,分析了为何出现大量Waiting for global read lock的连接。但是实际操作起来很多gdb版本不支持pset操作,而且连接过多,导致不可能手动打印每一个THD的state,所以笔者写了一个gdb的脚本供大家使用: 首先,先保存下面脚本到/tmp/getlockconn MySQL8.
2716 0
|
SQL 关系型数据库
[InnoDB 源码介绍] lock-free redo log in mysql8.0
InnoDB 和大部分的存储引擎一样, 都是采用WAL 的方式进行写入数据, 所有的数据都先写入到redo log, 然后后续再从buffer pool 刷脏到数据页 又或者是备份恢复的时候从redo log 恢复到buffer poll, 然后在刷脏到数据页, WAL很重要的一点是将随机写转换成了顺序写, 所以在机械磁盘时代, 顺序写的性能远远大于随机写的背景下, 充分利用了磁盘的性能.
1205 0
|
测试技术
[20171123]Skip Locked and ITL slot 2.txt
[20171123]Skip Locked and ITL slot 2.txt --//昨天看链接提到Skip Locked and ITL slot相关问题,链接 http://jonathanlewis.
1101 0