一次AWR报告引发的自我反省

简介:

AWR引发的血案

昨天一早到公司,例行巡检数据库服务器,CRS正常,实例正常,ASM正常,各项服务正常,后台进程正常,RMAN备份正常,做了一个AWR报告,矮油,不对,怎么snap_id只显示到5点就没再有了呢,算了,先不管他,忙东忙西的也没在意。

下午快下班的时候,测试部要测试数据库压力情况,希望抓一个15点到18点的报告,OK,easy,看熊熊来搞定,到了数据库里执行命令

clip_image001

一路走下去,唉,不对,为啥还是只有5点之前的snap_id,这时候冷汗已经下来了。

clip_image002

执行AWR的运行周期看了一下,没问题啊,使用的是默认配置的,每小时抓取一次,保留七天数据,没错啊,那是为啥呢? 诡异了。

clip_image003

为了搞定,手工生成了一下快照试了一下,卡住了,一直半个多小时都没反应(其实这时候熊熊应该找到问题所在了,但是由于着急回家就忽略了)

clip_image005

到家以后,从远程连接到数据,查找了一下最大的snap_id,发现一直处在凌晨5点那个snap_id就没更改过

又做了一次报告,按最长7天收集,发现只有100条snap_id,不算多啊,可是为什么呢?

clip_image007

想运行删除命令删除一些快照,却发现卡住不动了,我靠,XXD,不会让我删都删不了吧。

clip_image008

执行了一下后台进程查看,mmon和mmnl进程都正常使用ing啊,没有问题啊,见鬼了。

clip_image010

这时候忽然想到了,是不是空间不够了,使用命令查看了一下,确实,SYSAUX表空间使用率达到了92%左右,这是一个很尴尬的值,既不到自动扩展的时候,也因为预留的10%政策导致无法再写入数据(AWR报告的快照信息都写在这个表空间里),于是对这个表空间进行了一些简单的收缩工作,可是还是不行,TMD,真奇怪了。

clip_image012

通过上图命令可以查到表空间是否可以自动扩展。

继续执行快照删除命令,还是死在那里,XX,怎么会这样,忽然想起,还有一个该死的表空间忘记了,临时表空间。

clip_image014

查询临时表空间,4个临时表空间都满了(当初设置的太小),我晕死,问题就在这里了,删除了原有的临时表空间,并重建了新的临时表空间,同时为一些空间较小的表空间增加了数据文件,重启数据库后,该死的AWR终于又正常运作了。

clip_image016

正常登录以后,更改了AWR的收集阀值

clip_image018

重新查询,时间间隔已经为2小时一次,收集依然是保留7天,至此,AWR问题全部解决。

这个问题,从9点折腾到11点才解决,最终发现是表空间的问题,并且还重启了外网的数据库,最终我们会发现,往往问题都出现很小的地方,我们很不会留意到的地方,因此一次合理的规划很重要,这次错误感谢刘稳童鞋的技术支持和强强领导的信任与支持。



















本文转自bear_cat51CTO博客,原文链接:http://blog.51cto.com/bearlovecat/860733 ,如需转载请自行联系原作者

相关文章
|
9天前
|
机器学习/深度学习 算法 Go
朋友们,这篇JCR一区6分非肿瘤诊断模型的工作量,看完自我怀疑了
本文分享了一篇发表在《Computational and Structural Biotechnology Journal》上的研究,通过机器学习方法识别了败血症的潜在诊断和预后生物标志物。研究者分析了脓毒症和对照组的转录组数据,鉴定了11个差异表达基因,并通过LASSO和SVM-RFE算法选出了4个关键基因(YOD1、GADD45A、BCL11B和IL1R2)。这些基因显示出优秀的诊断和预后能力,且与免疫相关过程显著关联。此外,通过小鼠模型验证了这些基因的表达变化,为败血症的机制理解提供了新见解。
18 0
|
13天前
|
运维 监控 安全
如何写复盘报告
该内容是关于IT公司中复盘报告的撰写指南,主要包括五个步骤:1) 还原故障基本信息,如定级参考;2) 描述处理过程,按时间顺序列出关键点;3) 评估影响范围,可能涉及业务基线;4) 确定故障原因,从直接原因到根本原因层层分析;5) 分析责任归属和事件级别。复盘还包括故障回顾,提出优化措施以减少重演。内容还提到了一些参考资料,用于深入学习稳定性保障。
11 0
|
数据可视化 C++
R可视乎|回归诊断(文末送书)
Lindia 是 ggplot2 的扩展,提供更详细的线性模型诊断结果的可视化功能。Lindia 中的所有函数输入都必须为 lm 对象(包括 lm()和 glm() ),并以 ggplot 对象的形式返回线性诊断图。
204 0
R可视乎|回归诊断(文末送书)
公鼠怀孕论文停止撤稿,作者称受到非科学讨论攻击!回应伦理担忧:减轻了动物痛苦
公鼠怀孕论文停止撤稿,作者称受到非科学讨论攻击!回应伦理担忧:减轻了动物痛苦
158 0
|
SQL 搜索推荐 关系型数据库
没内鬼,来点干货!SQL优化和诊断
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! SQL优化与诊断 Explain诊断Explain各参数的含义如下: 列名说明 id执行编号,标识select所属的行。
没内鬼,来点干货!SQL优化和诊断
|
机器学习/深度学习 人工智能 机器人