索引的选择性

简介:
索引的选择性是指索引列中不同值的数目与表中记录数的比。如果一个表中有2000条记
录,表索引列有1980个不同的值,那么这个索引的选择性就是1980/2000=0.99。
  一个索引的选择性越接近于1,这个索引的效率就越高。
  如果是使用基于cost的最优化,优化器不应该使用选择性不好的索引。如果是使用基于
rule的最优化,优化器在确定执行路径时不会考虑索引的选择性(除非是唯一性索引),并
且不得不手工优化查询以避免使用非选择性的索引。
  确定索引的选择性,可以有两种方法:手工测量和自动测量。
  (1)手工测量索引的选择性

如果要根据一个表的两列创建两列并置索引,可以用以下方法测量索引的选择性:
  列的选择性=不同值的数目/行的总数 /* 越接近1越好 */
select count(distinct 第一列||'%'||第二列)/count(*)
from 表名
/
select count(distinct status||'%'||owner)/count(*)
from test;
/

如果我们知道其中一列索引的选择性(例如其中一列是主键),那么我们就可以知道另一列索引的选择性。
  手工方法的优点是在创建索引前就能评估索引的选择性。
  (2)自动测量索引的选择性
  如果分析一个表,也会自动分析所有表的索引。
  第一,为了确定一个表的确定性,就要分析表。
analyze table 表名 compute statistics
/
  第二,确定索引里不同关键字的数目:
select distinct_keys
from user_indexes
where table_name='表名'
and index_name='索引名'
/
  第三,确定表中行的总数:
select num_rows
from user_tables
where table_name='表名'
/
  第四,索引的选择性=索引里不同关键字的数目/表中行的总数:
select i.distinct_keys/t.num_rows
from
user_indexes i,
user_tables t
where i.table_name='表名'
and i.index_name='索引名'
and i.table_name=t.table_name
/
  第五,可以查询USER_TAB_COLUMNS以了解每个列的选择性。
  表中所有行在该列的不同值的数目:
select
column_name,
num_distinct
from user_tab_columns
where table_name='表名'
/
  列的选择性=NUM_DISTINCT/表中所有行的总数,查询USER_TAB_COLUMNS有助测量每个列
的选择性,但它并不能精确地测量列的并置组合的选择性。要想测量一组列的选择性,需要
采用手工方法或者根据这组列创建一个索引并重新分析表。









本文转自 牛海彬 51CTO博客,原文链接:http://blog.51cto.com/newhappy/77312,如需转载请自行联系原作者
目录
相关文章
|
1月前
|
索引
15. 索引是越多越好嘛? 什么样的字段需要建索引, 什么样的字段不需要 ?
是否越多索引越好?并非如此。应根据需求建索引:主键自动索引,频繁查询、关联查询、排序、查找及统计分组字段建议建索引。但表记录少,频繁增删改操作,频繁更新的字段,以及使用频率不高的查询条件则不需要建索引。
28 0
|
19天前
|
SQL 关系型数据库 MySQL
MySQL数据库——索引(6)-索引使用(覆盖索引与回表查询,前缀索引,单列索引与联合索引 )、索引设计原则、索引总结
MySQL数据库——索引(6)-索引使用(覆盖索引与回表查询,前缀索引,单列索引与联合索引 )、索引设计原则、索引总结
23 1
|
1月前
|
SQL 存储 关系型数据库
MySQL索引原理(索引、约束、索引实现、索引失效、索引原则)以及SQL优化
MySQL索引原理(索引、约束、索引实现、索引失效、索引原则)以及SQL优化
144 1
|
11月前
|
索引
索引是越多越好嘛? 什么样的字段需要建索引, 什么样的字段不需要 ?
索引是越多越好嘛? 什么样的字段需要建索引, 什么样的字段不需要 ?
89 0
|
11月前
|
关系型数据库 MySQL 索引
Mysql索引是越多越好嘛? 什么样的字段需要建索引, 什么样的字段不需要 ?
MySQL索引的数量并不是越多越好,过多的索引可能会导致性能下降和存储空间的浪费。
222 0
|
11月前
|
数据库 索引
索引是越多越好嘛? 什么样的字段需要建索引
索引的作用是加快数据库的查询速度,但并不是索引越多越好。过多的索引会增加数据库的存储空间和维护成本,并且在写操作时可能会降低性能。
174 0
|
存储 SQL 关系型数据库
【名词解释与区分】聚集索引、非聚集索引、主键索引、唯一索引、普通索引、前缀索引、单列索引、组合索引、全文索引、覆盖索引
【名词解释与区分】聚集索引、非聚集索引、主键索引、唯一索引、普通索引、前缀索引、单列索引、组合索引、全文索引、覆盖索引
248 1
【名词解释与区分】聚集索引、非聚集索引、主键索引、唯一索引、普通索引、前缀索引、单列索引、组合索引、全文索引、覆盖索引
|
存储 索引
为什么范围后索引会失效 存储引擎不能使用索引中范围条件右边的列
比如说有三个字段 a b c,建立复合索引a_b_c。此时叶子节点的数据排序后可能为
82 0
|
存储 SQL 关系型数据库
什么是索引覆盖?什么是索引下推?
什么是索引覆盖?什么是索引下推?
326 0
什么是索引覆盖?什么是索引下推?
|
关系型数据库 MySQL 开发者
索引分类和建索引命令语句|学习笔记
快速学习索引分类和建索引命令语句
79 0