Oracle优化10-SQL_TRACE

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: Oracle优化10-SQL_TRACE

思维导图


20161215214811188.png

Oracle优化10-SQL_TRACE解读

Oracle优化11-10046事件


概述


当我们想了解一条SQL或者是PL/SQL包的运行情况时,特别是当他们的性能非常差时,比如有的时候看起来就好好像卡在什么地方一样,该如何入手呢?


是不是恨不得钻进去看下到底发生了什么?


好在Oracle提供了我们这样的一种方法使用SQL_TRACE来跟踪SQL的执行情况,通过SQLTRACE我们可以很容易的知道当前正在执行的SQL正在干什么。


以下操作基于Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production


SQL_TRACE


SQL_TRACE命令会将SQL的执行过程输出到一个TRACE文件中,我们通过阅读这个TRACE文件就可以了解到在这个SQL执行的过程中,oracle究竟做了哪些事情。


如何开启SQL_TRACE

#设置sql_trace生成的文件标识,便于查找
SQL> alter session set tracefile_identifier='mytest';
Session altered
#对当前的会话开启sql_trace
SQL> alter session set sql_trace=true;
Session altered
SQL> 执行具体的sql
#关闭当前会话的sql_trace
SQL> alter session set sql_trace=false;

SQL_TRACE生成的文件在哪个目录下呢?


开启SQL跟踪后,会生成一个trace文件,通过初始化参数user_dump_dest配置其所在目录,该参数的值可以通过下面方法获取到:

select name, value from v$parameter where name = 'user_dump_dest'


oracle@entel2:[/oracle]$cd /oracle/diag/rdbms/cc/cc/trace
oracle@entel2:[/oracle/diag/rdbms/cc/cc/trace]$ls *mytest*
cc_ora_305_mytest.trc  cc_ora_305_mytest.trm


cc_ora_305_mytest.trc 就是我们的trace文件。


扩展:


11g中新增的trm文件


.trc文件称为Sql Trace Collection file,它是系统的跟踪文件(trace),当系统启动时或运行过程中出现错误时,系统会自动记录跟踪文件到指定的目录,以便于检查,这些文件需定期维护删除。


.trm file 全称是trace map file. 被称为跟踪元数据文件,.trm文件中的元数据描述了存储在.trc文件中的跟踪记录 。


.trm文件是伴随着.trc文件产生,一个.trm对应一个.trc文件。.trm文件包含.trc文件的结构化信息。


The files located in the TRACE directory, with the “.trm” extensions, are called Trace Metadata files. The metadata in .trm files describe the trace records stored inside of .trc trace files.


不指定文件标识时,如何查找呢?


如果我们没有指定标识时,改如何快速查找对应的trace文件呢?

trace文件的名字是独立于版本和平台的,在大部分常见的平台下,命名结构如下:


{instance name}_{process name}_{process id}.trc


知道当前会话的sid 便可以查找到

比如下面这种情况

20161214224138586.png


通过如下sql

select s.SID,
       s.SERVER,
       lower(case
               when s.SERVER in ('DEDICATED', 'SHARED') then
                i.INSTANCE_NAME || '_' || nvl(pp.SERVER_NAME, nvl(ss.NAME, 'ora')) || '_' ||
                p.SPID || '.trc'
               else
                null
             end) as trace_file_name
  from v$instance      i,
       v$session       s,
       v$process       p,
       v$px_process    pp,
       v$shared_server ss
 where s.PADDR = p.ADDR
   and s.SID = pp.SID(+)
   and s.PADDR = ss.PADDR(+)
   and s.TYPE = 'USER'
   and s.SID = '263'
 order by s.SID ;


20161214224827802.png

oracle@entel2:[/oracle/diag/rdbms/cc/cc/trace]$ls cc_ora_2642.trc
cc_ora_2642.trc

其他情况的说明

  • SQLTRACE除了设置会话级别,也可以设置系统级别
alter system set sql_trace=true;

这样就可以对实例上的全部SQL进行跟踪了,需要注意的是这种方式的代价是非常巨大的,请慎重操作。

  • 另外SQLTRACE也可以在初始化参数中设置
SQL> show parameter sql_trace
NAME             TYPE        VALUE
-------------- ----------- --------------
sql_trace        boolean     FALSE
  • 关闭会话级别的sql_trace, 除了使用
alter session set sql_trace=false ;


关闭外,直接退出sql_plus来终止也是可以的,只要关闭了当前会话,会话级别的sql_trace就失效了。


TKPROF工具

最原始的trace文件的可读性是比较差的,除非有必要,我们一般都是通过tkprof工具来处理这个trace文件。


TKPROF工具是oracle自带的一个工具,用于处理原始的trace文件,它的主要的作用就是合并汇总trace文件中的一些项,规范化文件的格式,是文件更具有可读性。

TKPROF使用

oracle@entel2:[/oracle/diag/rdbms/cc/cc/trace]$tkprof cc_ora_305_mytest.trc  mytest.txt
TKPROF: Release 11.2.0.4.0 - Development on Wed Dec 14 18:45:34 2016
Copyright (c) 1982, 2011, Oracle and/or its affiliates.  All rights reserved.

执行后,会生成mytest.txt文件,阅读更加方便。


TKPROF参数

在命令行下直接输入 tkprof ,回车,会看到tkprof支持的所有参数


20161214231349881.png


下面重点说一下常用的几个参数


explain=user/password

Connect to ORACLE and issue EXPLAIN PLAN.


在trace文件中输入SQL的执行计划。


需要注意的是,如果不使用explain,在trace文件中,我们看到的是SQL实际的执行路径。比如:


20161214235131437.png


使用explain, tkprof在trace文件中不但输入sql的实际执行路径,还会生成该SQL的执行计划。

比如:

oracle@entel2:[/oracle/diag/rdbms/cc/cc/trace]$tkprof cc_ora_305_mytest.trc  mytest_explain.txt  explain=cc/xgongjiang 
TKPROF: Release 11.2.0.4.0 - Development on Wed Dec 14 19:26:15 2016
Copyright (c) 1982, 2011, Oracle and/or its affiliates.  All rights reserved.

查看 mytest_explain.txt文件可以看到比上面的多了一个Execution Plan:


20161214235339033.png


上面的信息中,第一部分是SQL的实际执行路径,下面的部分是使用Explain for的方式生成的SQL执行计划。


sys=(yes|no)

如果设置为yes,在trace文件中将输出所有SYS用户的操作(也包含用户SQL语句引发的递归SQL),如果为no,则不输出。 默认为yes. 实际上设置为no,trace文件更具有可读性。

oracle@entel2:[/oracle/diag/rdbms/cc/cc/trace]$tkprof cc_ora_305_mytest.trc  mytest_explain_sysno.txt  explain=cc/xgongjiang sys=no
TKPROF: Release 11.2.0.4.0 - Development on Wed Dec 14 19:47:25 2016
Copyright (c) 1982, 2011, Oracle and/or its affiliates.  All rights reserved.

20161215000653613.png

左侧为默认yes,右侧为sys=no ,可以sys用户的操作被过滤掉,清晰了很多。


aggregate=yes|no


默认情况下,tkprof工具将所有相同的sql在输入文件中做合并,如果设置aggregate=no ,则分别列出每个sql的信息。

默认yes的情况:



20161215221322867.png

上面就是合并后的SQL,这样看起来比较简洁,如果你需要每一个SQL的单独信息,可以把aggregate设置为no ,如下所示:

设置为no的情况


20161215221414790.png

20161215221444575.png


TRACE文件解读


我们通过以下命令(过滤掉sys用户解析的sql,一般都是操作数据字典视图的sql)生成一个tkprof工具分析过的文件

oracle@entel2:$ tkprof cc_ora_305_mytest.trc  mytest_sysno.txt sys=no

20161215230137518.png


trace文件的头部信息描述了tkprof的版本,以及报告中一些列的含义。

在下面的报告中,每一条SQL都包含了这个SQL执行的所有信息,对于任何一条SQL都应该包含3个步骤(对应下表的call列)


20161215230521645.png

  • parse(分析) :SQL的分析阶段
  • execute(执行):SQL的执行阶段
  • fetch(数据提取):数据的提取阶段

横向除了call(调用)之外,还包括

  • Count:计数器,表示当前的操作被执行了多少次
  • Cpu:当前的操作消耗CPU的时间(单位秒)
  • Elapsed:当期的操作一共用时多少(包括CPU时间和等待时间)
  • Disk:当前操作的物理读(磁盘I/O次数)
  • Query:通常是查询的使用方式,当前操作的一致性方式读取的数据块数
  • Current:通常是修改数据使用的方式,当前操作的current的方式读取的数据块数
  • Rows:当前操作处理的数据记录数


在SQL的解析过程中,需要访问一些数据字典视图,通常来讲我们可能不需要用到,可以使用 tkprof sys=no的方式屏蔽掉它们。

下面的SQL我们可能需要注意一下。


20161215231712573.png


20161215231720644.png


上述SQL其实就是CBO在做动态采样的SQL语句,如果我们看到这条SQL语句,就知道CBO在这里采用了动态采样(另外一层的意思是说我们的表可能没有做分析)。

下面才是我们真正需要的信息,我们执行的SQL的trace信息


20161215232141138.png


从上图中我们可以看到这条SQL 被分析了一次,被执行了一次,数据提取了1次(数据提取也有可能多次提取完成)。


其中消耗CPU的资源0S,总耗时0S,物理读取了0个数据块(说明是从内存中读取的),一致性读取了12个数据块,没有发生current方式的读取(通常update的操作会发生current读取),一共提取数据记录数为3,正是查询出来的结果数.


20161215232756359.png

接下来我们继续分析:

20161215233613435.png


  • Misses in library cache during parse: 1–shared pool中没有命中,说明这是一次硬解析,软解析这里为0
  • Optimizer mode: ALL_ROWS–当前的优化器模式CBO All_ROWS、Parsing user id: 49–分析用户的id(根据user_id可以在all_user中查到对应的用户)
  • Number of plan statistics captured: 1 –统计到的分析计划统计数量
select a.* from all_users a where a.user_id = 49;

继续,下面是这条SQL的具体执行计划和执行消耗的资源信息。需要注意的是,这个计划里面的信息不是CBO根据表分析数据算出来的数值,而是SQL语句执行过程中消耗的资源信息。

20161215233708831.png

Rows (1st) —当前操作返回的实际返回的记录数

Row Source Operation–行源操作,表示当前操作的数据访问方式

cr—–consistent read 一致性防暑读取的数据块,相当于query列上Fetch步骤的值

pr—–physical read 物理读取的数据块,相当于disk列上的Fetch步骤的值

pw—–physical write 物理写

time=85 us —当前执行操作的时间 (微秒 )


1秒=1000毫秒(ms)

1秒=1000000 微秒(μs)

1秒=1000000000 纳秒(ns)


…………


如果在使用tkprof工具添加explain=username/passwd可一在文件中看到执行计划,如下:


20161215234645981.png


下面的部分是对这个SQL_TRACE期间所有非递归SQL(NON-RECURSIVE STATEMENTS)的执行信息统计汇总

20161216000454944.png

递归SQL: 执行一条SQL语句衍生出执行的一些其他的SQL,这些衍生出来的SQL就叫做递归SQL。


比如对SQL进行分析,需要读取一些数据字典来获取相关的信息,比如是否有权限,对象是否存在,对象的存储信息等,这些SQL都统称为递归SQL语句


下面是所有递归SQL语句的统计信息


20161216000636829.png


上面是一个完整的经过tkprof处理过的trace文件,它真是的统计了SQL语句在运行过程中的各种资源消耗,这个报告对于分析性能有问题的SQL语句非常重要。


但是这个报告只是一个汇总的结果集,入股想确切的知道SQL语句每一步的执行是如何操作的,就要分析原始的trace文件,虽然不易读,但是它能够让你确切的知道SQL在哪个点在做什么,以及SQL是如何工作的。


原始TRACE文件解读


原始文件开头部分记录了trace的文件路径和名称,trace生成时间,数据库的版本,操作系统的版本,实例名等信息,

下面我们截取对应SQL的原始文件来做下说明:


=====================
PARSING IN CURSOR #140535085375432 len=138 dep=0 uid=49 oct=3 lid=49 tim=1481751318263300 hv=3651439770 ad='1c3714c98' sqlid='cjxrhfzcu934u'
select a.*, a.rowid
  from price a
 where a.price_ver_id in
       (select a.price_ver_id from price_ver a where a.rate_plan_id = 11566)
END OF STMT
PARSE #140535085375432:c=13000,e=12343,p=0,cr=100,cu=0,mis=1,r=0,dep=0,og=1,plh=282154677,tim=1481751318263300
EXEC #140535085375432:c=0,e=15,p=0,cr=0,cu=0,mis=0,r=0,dep=0,og=1,plh=282154677,tim=1481751318263369
FETCH #140535085375432:c=0,e=118,p=0,cr=6,cu=0,mis=0,r=3,dep=0,og=1,plh=282154677,tim=1481751318266947
STAT #140535085375432 id=1 cnt=3 pid=0 pos=1 obj=0 op='NESTED LOOPS  (cr=6 pr=0 pw=0 time=85 us cost=1 size=906 card=2)'
STAT #140535085375432 id=2 cnt=3 pid=1 pos=1 obj=0 op='NESTED LOOPS  (cr=5 pr=0 pw=0 time=61 us cost=1 size=906 card=2)'
STAT #140535085375432 id=3 cnt=1 pid=2 pos=1 obj=65903 op='TABLE ACCESS BY INDEX ROWID PRICE_VER (cr=3 pr=0 pw=0 time=32 us cost=1 size=26 card=1)'
STAT #140535085375432 id=4 cnt=1 pid=3 pos=1 obj=67745 op='INDEX RANGE SCAN IDX_PRICE_VER_RATE_PLAN (cr=2 pr=0 pw=0 time=11 us cost=1 size=0 card=1)'
STAT #140535085375432 id=5 cnt=3 pid=2 pos=2 obj=67731 op='INDEX RANGE SCAN IDX_PRICE_PRICE_VER_ID (cr=2 pr=0 pw=0 time=29 us cost=0 size=0 card=2)'
STAT #140535085375432 id=6 cnt=3 pid=1 pos=2 obj=64267 op='TABLE ACCESS BY INDEX ROWID PRICE (cr=1 pr=0 pw=0 time=11 us cost=0 size=854 card=2)'
CLOSE #140535085375432:c=0,e=6,dep=0,type=0,tim=1481751318315779
PARSE #140535085337488:c=0,e=26,p=0,cr=0,cu=0,mis=0,r=0,dep=0,og=1,plh=0,tim=1481751318315871
EXEC #140535085337488:c=0,e=80,p=0,cr=0,cu=0,mis=0,r=1,dep=0,og=1,plh=0,tim=1481751318315973
*** 2016-12-14 18:04:51.094
CLOSE #140535085337488:c=0,e=25,dep=0,type=3,tim=1481753091094976
=====================

20161216001328662.png

我们看到Oracle对这条SQL语句进行分析,并且有一个游标号:CURSOR #140535085375432 , 这个号在整个trace文件中并不是唯一的,当一条SQL语句执行完毕后,这个号会被另外的SQL语句重用。


我们还可以看到这个SQL语句被分析了一次,执行了一次,fetch了一次。


20161216004438863.png


如果有多次,这里会有多条记录。


STAT #140535085375432 是对这条SQL语句执行过程中的资源消耗的统计,trace文件中信息的输出顺序就是SQL的执行顺序,通过这些顺序就可以了解到SQL语句是如何一步一步的执行的。


下面对里面的一些指标信息进行注释下,以便更好的理解原始的TRACE文件。


PARSING IN CURSOR 部分


len=138: 被分析SQL的长度

dep=0 :产生递归SQL的深度

uid=49 :user id

oct=3 :Oracle command type 命令的类型

lid=49 : 私有的用户id

tim=1481751318263300 :时间戳

hv=3651439770 :hash value

ad=’1c3714c98’ :SQL address

sqlid=’cjxrhfzcu934u’ : SQL_ID


PARSE /EXEC /FETCH部分


c=13000 : 消耗的CPU时间,

e=12343:elapsed time的操作用时,

p=0:physical reads 物理读的次数,

cr=100:consistent reads 一致性方式读取的数据块,

cu=0:current方式读取的数据块,

mis=1:cursor miss in cache 硬分析的次数,

r=0:rows处理的行数,

dep=0:depth递归SQL的深度,

og=1:optimizer goal优化器模式,

plh=282154677:,

tim=1481751318263300:时间戳


STATS部分


id=2 :执行计划的行源号

cnt=3 :当前行源返回的行数

pid=1 :当前行源号的父号

pos=1 :执行计划中的位置

obj=0 :当前操作的对象id(如果当前行原始一个对象的话)

op=’NESTED LOOPS :当前行源的数据访问操作

相关文章
|
20天前
|
SQL Oracle 数据库
使用访问指导(SQL Access Advisor)优化数据库业务负载
本文介绍了Oracle的SQL访问指导(SQL Access Advisor)的应用场景及其使用方法。访问指导通过分析给定的工作负载,提供索引、物化视图和分区等方面的优化建议,帮助DBA提升数据库性能。具体步骤包括创建访问指导任务、创建工作负载、连接工作负载至访问指导、设置任务参数、运行访问指导、查看和应用优化建议。访问指导不仅针对单条SQL语句,还能综合考虑多条SQL语句的优化效果,为DBA提供全面的决策支持。
55 11
|
2月前
|
SQL 缓存 监控
大厂面试高频:4 大性能优化策略(数据库、SQL、JVM等)
本文详细解析了数据库、缓存、异步处理和Web性能优化四大策略,系统性能优化必知必备,大厂面试高频。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:4 大性能优化策略(数据库、SQL、JVM等)
|
2月前
|
SQL 缓存 数据库
SQL慢查询优化策略
在数据库管理和应用开发中,SQL查询的性能优化至关重要。慢查询优化不仅可以提高应用的响应速度,还能降低服务器负载,提升用户体验。本文将详细介绍针对SQL慢查询的优化策略。
|
2月前
|
SQL 存储 BI
gbase 8a 数据库 SQL合并类优化——不同数据统计周期合并为一条SQL语句
gbase 8a 数据库 SQL合并类优化——不同数据统计周期合并为一条SQL语句
|
2月前
|
SQL 数据库
gbase 8a 数据库 SQL优化案例-关联顺序优化
gbase 8a 数据库 SQL优化案例-关联顺序优化
|
2月前
|
SQL 数据库 UED
SQL性能提升秘籍:5步优化法与10个实战案例
在数据库管理和应用开发中,SQL查询的性能优化至关重要。高效的SQL查询不仅可以提高应用的响应速度,还能降低服务器负载,提升用户体验。本文将分享SQL优化的五大步骤和十个实战案例,帮助构建高效、稳定的数据库应用。
94 3
|
2月前
|
SQL 存储 缓存
如何优化SQL查询性能?
【10月更文挑战第28天】如何优化SQL查询性能?
184 10
|
2月前
|
SQL 存储 缓存
SQL Server 数据太多如何优化
11种优化方案供你参考,优化 SQL Server 数据库性能得从多个方面着手,包括硬件配置、数据库结构、查询优化、索引管理、分区分表、并行处理等。通过合理的索引、查询优化、数据分区等技术,可以在数据量增大时保持较好的性能。同时,定期进行数据库维护和清理,保证数据库高效运行。
|
2月前
|
SQL Oracle 关系型数据库
Oracle数据库优化方法
【10月更文挑战第25天】Oracle数据库优化方法
58 7
|
2月前
|
存储 Oracle 关系型数据库
Oracle数据库优化策略
【10月更文挑战第25天】Oracle数据库优化策略
37 5

推荐镜像

更多