从执行计划的预估行数看执行计划是否正确

简介:   从执行计划的预估行数可以看出执行计划是否正确,作为优化的你曾经注意到了么?   今天在监控系统垃圾sql语句的时候发现一个sql语句跑了10个小时了,凭直觉这个sql肯定哪里出现问题了,好吧,...

 

从执行计划的预估行数可以看出执行计划是否正确,作为优化的你曾经注意到了么?

 

今天在监控系统垃圾sql语句的时候发现一个sql语句跑了10个小时了,凭直觉这个sql肯定哪里出现问题了,好吧,老规矩,先看看内存中执行计划和具体的sql语句吧,这里的sql语句:

INSERT /*+ append */ INTO CJG_MID_ACCT(ACCT,PARTY_NO,CHINESE_NAME,DATE_OPENED,RMB_CURRENT_BAL,BILL_DATE,RMB_CRLIM,AI_LAST,PSTL_CD,BIRTHDAY,GENDER,APPLICATION_NO,RMB_BLOCK_CODE_1,RMB_BLOCK_CODE_1_MEMO,RMB_BLOCK_CODE_2,RMB_BLOCK_CODE_2_MEMO,USD_CURRENT_BAL,USD_BLOCK_CODE_1,USD_BLOCK_CODE_1_MEMO,USD_BLOCK_CODE_2,USD_BLOCK_CODE_2_MEMO,DATE_ACTIVE,CURRENT_CARD_CNT,EDUCATION_DEGREE,INDUSTRY_TYPE,COMPANY_ATTRIBUTE,SALES_CODE,ANNUAL_INCOME,SOURCE_CODE,UTILIZATION_FLAG,CURRENT_FLAG,MOB,AGE,SFNAME,CITY,AI_FIRST) SELECT A.*,C.ACCT_ACTIVE_DATE AS DATE_ACTIVE, B.CURRENT_CARD_CNT,D.EDUCATION_DEGREE, D.INDUSTRY_TYPE,D.COMPANY_ATTRIBUTE,D.SALES_CODE,D.ANNUAL_INCOME,D.SOURCE_CODE, 'N' AS CURRENT_FLAG,'N' AS CURRENT_CURRENT_FLAG, TRUNC(MONTHS_BETWEEN(TO_DATE(SUBSTR(:B1 ,1,6),'yyyymm'),TO_DATE(SUBSTR(DATE_OPENED,1,6),'yyyymm')),0) AS MOB, FLOOR((TO_DATE(:B1 ,'yyyymmdd')-TO_DATE(A.BIRTHDAY,'yyyymmdd'))/365) AS AGE, NVL(E.SFNAME,'其他') AS SFNAME,NVL(E.QXNAME,'其他') AS CITY,D.AI AS AI_FIRST FROM TEMP_MID_ACCT_TMP02 A LEFT JOIN TEMP_MID_ACCT_CARDCNT B ON A.ACCT=B.ACCT LEFT JOIN TEMP_MID_ACCT_ACTIVED C ON A.ACCT=C.POST_TO_ACCT LEFT JOIN RISKREPT.RKO_CDM_PROCESS D ON A.APPLICATION_NO=D.APPLICATION_NO LEFT JOIN DIC_ZIP_CODE E ON SUBSTR(A.PSTL_CD,1,4)=E.ZIPCODE;

 

执行:SELECT * FROM TABLE(DBMS_XPLAN.DISPLAY_CURSOR('djmga872c636s',0,'advanced')); 得到执行计划如下图:

 

从执行计划其实就可以看出问题来了,我们这里再多走一步吧,先看看历史sql中,这个语句跑了多久呢?

select * from XB_SQL_MONITOR_LHR a where a.SQL_ID='djmga872c636s';

可以看出历史sql中这条语句仅仅跑了45分钟,好吧,我们再看看历史sql的执行计划吧:

select DBMS_XPLAN.display_awr(sql_id => 'djmga872c636s') from dual;

 

这里我截取了其中一个我认为正确的执行计划,大家从附件中可以看到有很多历史执行计划,,好了,,,,废话少说吧,,,,,,,,,

所有历史执行计划参考附件,建议使用UE或者ediplus打开:img_e25d4fb2f8de1caf41a735ec53088516.pngsqlid(djmga872c636s)的历史sql执行计划.sql

 

到这里我们知道,这个sql的执行计划改变过,正确的预估行数少的有2000行,多的有1000W+的数据,好吧,我们在从数据字典中具体查看一下涉及到的表的具体行数吧,请看:

SELECT *

FROM vq_table_lhr a

WHERE a.TABLE_NAME IN ('TEMP_MID_ACCT_TMP02',

'TEMP_MID_ACCT_CARDCNT',

'TEMP_MID_ACCT_ACTIVED',

'RKO_CDM_PROCESS',

'DIC_ZIP_CODE')

;

可以看出,相关的5个表,最小的1M,最大的有31G,怎么可能num_rows和blocks都为0呢?操蛋,,,,,oracle自动收集不智能,,,,,,当然也有可能是空表,高水位没有降下来,没事,我们收集统计信息后再看看就知道了,执行:

BEGIN

 

dbms_stats.gather_table_stats(USER, 'DIC_ZIP_CODE',cascade => TRUE,degree => 8);

dbms_stats.gather_table_stats(USER, 'TEMP_MID_ACCT_ACTIVED',cascade => TRUE,degree => 8);

dbms_stats.gather_table_stats(USER, 'TEMP_MID_ACCT_CARDCNT',cascade => TRUE,degree => 8);

dbms_stats.gather_table_stats(USER, 'TEMP_MID_ACCT_TMP02',cascade => TRUE,degree => 8);

dbms_stats.gather_table_stats('RISKREPT', 'RKO_CDM_PROCESS',cascade => TRUE,degree => 20);

 

END;

 

表比较多,分析比较慢,,,等等等等,,,,,,不要急嘛,,,在神马都是快节奏的今天我们更应该时不时的停下我们繁忙的脚步看看周边美丽的风景的,,,,,,,千呼万唤始出来,,,,,,,对表进行分析执行完成后,继续查看,行数和块数:

 

SELECT *

FROM vq_table_lhr a

WHERE a.TABLE_NAME IN ('TEMP_MID_ACCT_TMP02',

'TEMP_MID_ACCT_CARDCNT',

'TEMP_MID_ACCT_ACTIVED',

'RKO_CDM_PROCESS',

'DIC_ZIP_CODE')

;

 

 

好吧,大家可以看出num_rows和blocks都正确了,最大的表竟然有3500W+的数据,难怪跑这么慢,同时也证明了之前我们猜测可能是表的高水位没有降下来这个结论是错误的,我们再重新跑一跑之前的sql语句,捕捉一下执行计划,偷懒一下,直接用plsql developer工具来看吧:

 

好了,应该没有神马问题了,,,,,,


结论


1、有关CBO模式下,统计信息一定要准确,不然可能出现N多不知神马的问题,sql执行计划瞎走,之前哥还遇到过统计信息不准确导致执行计划走了笛卡尔积连接了,晕晕晕,,,,,,啥事都有,,,,,,不过那个例子忘记截取下来了

2、另外,大家可以写一个定时的job,对这一类统计信息错误的表定时分析,或者如果表的数据量变化不是很大的情况下,我们可以锁定这些临时表的统计信息,不让系统的job对这些表重新分析

3、网上有大牛说我们看AWR报告的时候要有一双敏锐的鹰眼,这里我也提出看执行计划的时候我们同样应该具备一双更敏锐的鹰眼,瞅一眼就知道哪里的问题了,请看这只眼:

 

目录
相关文章
|
SQL 存储 关系型数据库
几个必须掌握的SQL优化技巧(三):Explain分析执行计划
在应用的开发过程中,由于开发初期的数据量一般都比较小,所以开发过程中一般都比较注重功能上的实现,但是当完成了一个应用或者系统之后,随着生产数据量的急剧增长,那么之前的很多sql语句的写法就会显现出一定的性能问题,对生产的影响也会越来越大,这些不恰当的sql语句就会成为整个系统性能的瓶颈,为了追求系统的极致性能,必须要对它们进行优化。
303 0
几个必须掌握的SQL优化技巧(三):Explain分析执行计划
|
SQL 关系型数据库
冗余数据JOIN导致的慢SQL优化一例
CASE 一个这样的查询,每个表都只有几千条数据,但是查询非常慢,几十秒不出结果。 select distinct abc.pro_col1, abc.col3 from t0 p INNER JOIN t1 abc on p.id=abc.par_col2
4854 0
|
SQL 索引 存储
执行计划的生成
原文:执行计划的生成   SQL Server使用许多技术来优化资源消耗: 基于语法的查询优化; 无用计划匹配以避免对简单查询的深度优化; 根据当前分布统计的索引和连接策略; 多阶段的查询优化以控制优化开销; 执行计划缓冲以避免重新生成执行计划;   以上技术按以下顺序执行: 解析器; 代数化器; 查询优化器; 执行计划生成,缓冲和hash计划生成; 查询执行;   其执行顺序如下:    一、解析器(parser)   当查询被提交时,SQL Server将它传递给关系引擎中的解析器。
1142 0
|
SQL Oracle 关系型数据库
SQL为什么预估执行计划与真实执行计划会有差异?
SQL为什么预估执行计划与真实执行计划会有差异?http://www.bieryun.com/3149.html 一 问题概要 对同一个 SQL 语句的 ExplainPlan 里显示的预估执行计划与通过 V$SQL_PLAN 视图获取的 Runtime Plan 真实执行计划,偶尔会发现两边有不一致的情况,为什么呢?为什么预估执行计划会不准确?怎样才能避免这种情况的发生? 二 问题解答 这是执行计划相关中会被经常问道的问题,也是困扰自己很长时间的问题。
1494 0
Hawkeye:TopN慢query的获取与优化
之前的文章介绍了Hawkeye的底层分析系统(待补充文章),其中讲到了基于Blink的Batch任务实现方法,前段时间在优化慢query查询的过程中开发了应用TopN慢query获取的分析任务,其中用到的分析方法适用于其他类似求TopN的问题中。
1968 0
|
SQL 数据库 索引

热门文章

最新文章