谁动了我的索引(三)

简介:
环境介绍:
SQL> desc t1;
Name Null? Type
----------------------------------------- -------- ----------------------------
NN NOT NULL NUMBER
CNN NUMBER
R ROWID

SQL> select count(distinct nn) a,count(distinct cnn) b,count(*) c from t1;

A B C
---------- ---------- ----------
2 201275 402550

SQL> select nn,count(*) from t1 group by nn;

NN COUNT(*)
---------- ----------
1 1
99 402549

SQL> select index_name from user_indexes where table_name = 'T1';

no rows selected
case 7:
关键字:组合索引,谓词,索引列
我们在使用一个B树索引,而且谓词中没有使用索引的最前列。如果是这种情况,可以假设有一个表T,在T(x,y)上有个索引,我们要如下查询:select * from t where y = 5。此时,CBO就不打算使用T(x,y)上的索引,因为谓词不涉及x列。在这种情况下,如果使用索引,可能必须查看每一个索引条目(稍后讨论 index skip scan),而CBO通常倾向于对T做一个全表扫描。
SQL> create index idx_t1_cnn_nn on t1(cnn,nn);

Index created.

SQL> exec dbms_stats.gather_table_stats(user,'T1',cascade=>true);

PL/SQL procedure successfully completed.

SQL> set autot traceonly;
SQL> select * from t1 where nn = 1;


Execution Plan
----------------------------------------------------------
Plan hash value: 3617692013

--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 17 | 329 (4)| 00:00:04 |
|* 1 | TABLE ACCESS FULL| T1 | 1 | 17 | 329 (4)| 00:00:04 |
--------------------------------------------------------------------------
当然,这并不完全排除使用索引。如果:
SQL> select nn,cnn from t1 where nn = 1;
优化器就会注意到,它不必全扫描表来得到nn,cnn,对索引本身做一个index fast full scan会更合适,因为这个索引一般比底层表小得多。如下:

Execution Plan
----------------------------------------------------------
Plan hash value: 3065609956

--------------------------------------------------------------------------------
------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time
|

--------------------------------------------------------------------------------
------

| 0 | SELECT STATEMENT | | 1 | 8 | 244 (5)| 00:0
0:03 |

|* 1 | INDEX FAST FULL SCAN| IDX_T1_CNN_NN | 1 | 8 | 244 (5)| 00:0
0:03 |

--------------------------------------------------------------------------------

另一种情况CBO也会使用T(x,y)上的索引,这就是index skip scan。 当且仅当索引的最前列的选择性很低(只有很少的几个不同值):
我们知道nn的选择性很低,所以,我们重新建立索引。
SQL> drop index idx_t1_cnn_nn;

Index dropped.

SQL> create index idx_t1_nn_cnn on t1(nn,cnn);

Index created.

SQL> exec dbms_stats.gather_table_stats(user,'T1',cascade=>true);

PL/SQL procedure successfully completed.

SQL> set autot traceonly;

当做以下查询时( cnn不是索引的第一列 ):
SQL> select * from t1 where cnn = 100;
结果如下:

Execution Plan
----------------------------------------------------------
Plan hash value: 1275931045

--------------------------------------------------------------------------------
-------------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU
)| Time |

--------------------------------------------------------------------------------
-------------

| 0 | SELECT STATEMENT | | 2 | 34 | 5 (0
)| 00:00:01 |

| 1 | TABLE ACCESS BY INDEX ROWID| T1 | 2 | 34 | 5 (0
)| 00:00:01 |

|* 2 |  INDEX SKIP SCAN | IDX_T1_NN_CNN | 2 | | 3 (0
)| 00:00:01 |

--------------------------------------------------------------------------------
-------------
index skip scan告诉Oracle姚跳跃式扫描这个索引,查找nn值有改变的地方,并且那里开始向下读树,然后扫描索引查找cnn =100。
总结:考虑查询只包括一个查询条件的情况,如果是选择性强的列作为前缀列,当查询指定选择性不高的列时,Oracle不会选择索引。而对于选择性差的列作为前缀列,当查询指定选择性高的列时,Oracle可以使用索引SKIP扫描。

case 8 :
关键字:绑定变量
在实际应用中,为了减少语句的解析(十分消耗资源),要常常使用到绑定变量。那它是不是十全十美的呢?让我们peek里面的秘密吧:
SQL> alter system flush shared_pool;

System altered.

SQL> alter system flush buffer_cache;

System altered.

SQL> alter session set tracefile_identifier = 'test';

Session altered.

SQL> alter session set sql_trace = true;

Session altered.

SQL> variable vn number;( ←定义一个绑定变量
SQL> exec :vn := 99;

PL/SQL procedure successfully completed.

SQL> select * from t1 where nn = :vn;

********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.01 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 1755 0.05 0.51 96 1836 0 26311
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 1757 0.07 0.52 96 1836 0 26311

Misses in library cache during parse: 1
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
26311  TABLE ACCESS FULL T1 (cr=1836 pr=96 pw=0 time=130246 us)

********************************************************************************

这时优化器的选择是全表扫描,是OK的。接下来,改变绑定变量的值:

SQL> exec :vn := 1;

PL/SQL procedure successfully completed.

我们知道,根据 case 3 的结论,应该是走索引的,那来执行一下:

SQL> select * from t1 where nn = :vn;

********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 2 0.31 1.78 1345 1446 0 1
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 4 0.31 1.78 1345 1446 0 1

Misses in library cache during parse: 0
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
1 TABLE ACCESS FULL T1 (cr=1446 pr=1345 pw=0 time=65 us)

********************************************************************************

敏感词,*&……*&……*%&……¥&%……*……&*,和谐词,*&*((*)
这不是我们所期望的,我们期望的是INDEX RANGE SCAN。单显然优化器使用了全表扫描。这个查询的就像它有谓词where nn = 99一样。这就是绑定变量窥视(bind peeking)了。查询第一次是硬解析( Misses in library cache during parse: 1 ),优化器考虑绑定变量的值并生成执行计划。当再次查询的时候又进行了全表扫描,直接使用了第一次硬解析生成的执行计划( Misses in library cache during parse: 0 )。也就是bind peeking只是在hard parse发生,任何重用这个特定计划的查询都将使用全表扫描。
下面,颠倒执行顺序来验证这一结论:
SQL> alter system flush shared_pool;

System altered.

SQL> alter system flush buffer_cache;

System altered.

SQL> alter session set sql_trace = true;

Session altered.

SQL> exec :vn := 1;

PL/SQL procedure successfully completed.

SQL> select * from t1 where nn = :vn;

********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 2 0.00 0.00 24 5 0 1
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 4 0.00 0.01 24 5 0 1

Misses in library cache during parse: 1
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
1 TABLE ACCESS BY INDEX ROWID T1 (cr=5 pr=24 pw=0 time=2184 us)
INDEX RANGE SCAN  IDX_T1_NN_CNN (cr=4 pr=16 pw=0 time=1314 us)(object id 52618)

********************************************************************************


SQL> exec :vn := 99;

PL/SQL procedure successfully completed.

SQL> select * from t1 where nn = :vn;


********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 178 0.01 0.02 104 2841 0 2656
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 180 0.01 0.02 104 2841 0 2656

Misses in library cache during parse: 0
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
2656 TABLE ACCESS BY INDEX ROWID T1 (cr=2841 pr=104 pw=0 time=31930 us)
2656  INDEX RANGE SCAN  IDX_T1_NN_CNN (cr=185 pr=8 pw=0 time=10659 us)(object id 52618)

********************************************************************************

当SQL第一次执行的时候,优化器会根据绑定变量来确定执行计划(如果存在柱状图)。BIND PEEKING只有当该SQL第一次执行的时候,进行HARD PARSE的时候才进行,第二次调用该SQL,就不会再次进行BIND PEEKING。这种情况下,就存在另外一个风险,如果某个列的倾斜性很厉害,那么使用BIND PEEKING就是不安全的,因为不同的参数代入,只能走第一次执行时的执行计划,那么执行计划就像掷色子一样,要靠运气了。碰到这种情况,应用就不应该使用绑定变量,而应该改为直接值了。
So,温馨提示:
使用绑定变量的时候可以有效的减少PARSE
对于使用不同绑定变量执行计划应该不同的情况,建议不要使用绑定变量,否则可能会产生随机的执行计划


至此,总结了一下常见了不走索引的情况,和筒子们分享了一下。其实实际的情况以及每个知识点都可以进一步深入,里面还有很多细节问题。不过为了主线清晰,没有拓展。希望大家能够深入研究,共同探讨。感谢收看



本文转自MIKE老毕 51CTO博客,原文链接:http://blog.51cto.com/boylook/1298611,如需转载请自行联系原作者


相关文章
|
4天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
296 116
|
19天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
7天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
462 44
Meta SAM3开源:让图像分割,听懂你的话
|
13天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
685 222
|
1天前
|
Windows
dll错误修复 ,可指定下载dll,regsvr32等
dll错误修复 ,可指定下载dll,regsvr32等
134 95
|
11天前
|
人工智能 移动开发 自然语言处理
2025最新HTML静态网页制作工具推荐:10款免费在线生成器小白也能5分钟上手
晓猛团队精选2025年10款真正免费、无需编程的在线HTML建站工具,涵盖AI生成、拖拽编辑、设计稿转代码等多种类型,均支持浏览器直接使用、快速出图与文件导出,特别适合零基础用户快速搭建个人网站、落地页或企业官网。
1680 158
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
931 61