本节书摘来自华章计算机《Oracle数据库性能优化方法论和最佳实践》一书中的第2章,第2.2节,作者:柳遵梁 潘敏君 应以峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看
2.2 基于OWI的优化方法论
2.2.1 OWI优化方法论简述
OWI,是Oracle Wait Interface的简称。最开始OWI并不是为了性能优化而出现的,而是出于调试的目的,用来明确当前正在发生什么事情,在Oracle 7中它就已经以初级的方式存在了。当Oracle 8i极其明确地把OWI引入性能优化时,数据库性能优化方法论就出现了划时代的飞跃。OWI方法论让Oracle第一次跳出部件构成性能的视野,从一个旁观者的角度或者业务流程的角度来考虑问题,使其与现实世界的基于流程协调的流程优化相符合。
排队和冲突是现实世界中时时刻刻普遍发生的事件,我们吃饭要排队、购物要排队、上车要排队、看病要排队,甚至走路都要排队。如果不想被前面的人或者物堵住,需要不断地变换通道或者将障碍进行拆除,我们的观点和行为会不断地发生冲突。Oracle OWI方法论充分地认识到了排队和冲突是生活的主题,是数据库流程的主题。例如,特别典型的是看医生,每个人都有切身体会。排队挂号,排队看医生,排队检查,排队拿药,各种排队合计3个小时,医生看病处理不超过5分钟。只要可以降低排队时间,就可以提高效率,降低时间成本。OWI就是基于这个朴素的理念的,只要使各种等待所消耗的时间尽可能低,就可以提高业务系统的性能。对于Oracle来说,OWI的发展就是尽可能精细地衡量等待事件;对于性能优化者而言,就是发现等待事件的原因并且尽可能降低或者消除它。
OWI方法是快速优化Oracle性能的最有效方式,OWI的精准定位使性能优化不再需要到处进行衡量。某种程度上,OWI方法论类似于故障处理的思路,处理焦点在局部,使优化者无需了解业务流程,无需进行全局流程的协调,降低了对性能优化者的能力要求。
至今为止,OWI方法依然是最为快速有效的性能优化方法。虽然如此,由于OWI关注的局限性,有一些缺陷,使其解决复杂的性能问题时有些力不从心,更多只作用在突然变化的性能异变上。
OWI方法事实上并不是从业务(流程)的角度看问题,而是从CPU的角度看问题,只要CPU一直处于忙碌之中,就假设性能是优异的。这就忽略了在很多场合下 CPU的处理效率才是性能问题的本源所在。OWI方法从本质上与基于局部命中率分析方法类似,都是眼睛向内看。一个是只要我忙,系统就好;一个是只要我好,系统就好,总体来说都缺乏流程的概念。OWI的使用如此简单,效果是如此出色,使绝大部分性能优化者不再去关心流程,而仅关心发生性能问题的某一点。OWI方法在快速优化性能的同时,事实上割裂了业务流程之间的关系,往往使复杂的性能优化工作顾此失彼。
OWI优化工作者总是精心研究常见的Oracle等待事件,研究其等待事件可能发生的原因以及对应的解决方案。OWI优化方法获得各个级别DBA的厚爱,除了其简单有效之外,最为重要的原因在于其可以不用过多考虑业务相关问题,只用采用故障解决的思维逻辑来解决性能优化问题。
2.2.2 OWI方法论的可检测体系
Oracle数据库为基于OWT的优化方法论提供了极为完善的可测量体系,且包含极为丰富的不同粒度,从session级别到对象级别到系统级别,从实时信息到时间点快照,甚至在SQL级别也尽可能提供准确的等待事件信息。
1.?基于session的Oracle wait event实时及统计信息
当前实时的wait event信息:v$session、v$session_wait、v$session_wait_class。
最近10次的wait event信息:v$session_wait_history。
100ms到秒级别的快照信息:v$active_session_history。
时间范围快照:wrh$_active_session_history。
抽样:dba_hist_active_sess_history。
启动以来的事件统计信息:v$session_event。
2.?基于对象的Oracle wait event的信息
启动以来对象的实时统计信息:V$SEGMENT_STATISTICS。
时间范围快照:WRH$_SEG_STAT。
3.?基于实例/全局的Oracle wait event的信息
1)基于实例的Oracle wait event信息。
分钟级别的实时统计信息:v$eventmtric、v$WAITCLASSMETRIC。
基于时间范围快照的统计信息:wrh$_system_event、wrh$_bg_event_summary、DBA_HIST_WAITSTAT。
启动以来的事件统计信息:v$system_event、$SYSTEM_WAIT_CLASS、V$SERVICE_EVENT。
2)均衡平均化的事件柱状体信息:
启动以来的等待事件柱状图信息:V$event_histogram。
时间范围快照的等待事件柱状图信息:wrh$_event_histogram。
3)特定事件的等待事件统计:
启动以来的buffer busy wait Event: v$waitstat。
时间范围快照的buffer busy wait Event: wrh$_waitstat。
4)等待事件的相互链接关系:
等待session之间的等待事件链:V$wait_chains(Oracle 11g)。
4.?基于SQL的等待事件描述
实时的session事件信息:v$session。
实时的SQL级别事件信息:v$sql_monitor。
100ms~1s级别的事件信息:v$active_session_history。
基于快照和抽样:wrh$_active_session_history、dba_hist_wait_history、wrh$_sqlstat。
启动以来的统计:v$sql、v$sqlarea、v$sqlstat。
2.2.3 OWI方法中wait event的发展
Oracle数据库在OWI方法上投入了大量的精力,每一个版本的更新都在OWI可测量指标体系上做出了持续改进。
Oracle 10gR2共有12个事件分类,合计事件数量874个,如图2-2所示。
Oracle 11gR2共有13个事件分类,合计事件数量1116个,如图2-3所示。
无论是874个等待事件还是1116个等待事件,它们都是一个极为惊人的数字,在缺乏有效背景资料的前提下,几乎很难对所有等待事件进行研究,这使性能优化者陷入一定的困境。OWI方法在这里真正体现了故障排除的思维逻辑,经验的积累对于性能优化者来说起到了决定性作用。