数据库 -- 索引并不是万能的

简介: 数据库 -- 索引并不是万能的

数据库 -- 索引并不是万能的

在这里插入图片描述

索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。如果想按特定职员的姓来查找他或她,则与在表中搜索所有的行相比,索引有助于更快地获取信息。但是索引也不是万能的 ,有时候发现我们 sql 中索引不生效的,我们深入理解下索引的原理,以及误区,


InnoDB是如何存储数据的?

MySQL把数据存储和查询操作抽象成了存储引擎,不同的存储引擎,对数据的存储和读取方式各不相同。MySQL支持多种存储引擎,并且可以以表为粒度设置存储引擎。因为支持事物,我们最常用的是InnoDB

虽然数据保存在磁盘中,但其处理是在内存进行的。为了减少磁盘随机读取次数,InnoDB 采用页而不是行但粒度来保存数据,即数据被分成若干页,以页为单位保存在磁盘中,InnoDB的页大小,一般是16kb。各页中又一个页目录,方便按照主键查询记录。

数据页结构:

在这里插入图片描述

页目录通过槽把记录分成不同的小组,没个小组有若干条记录。如图所示,记录中最前面的小方块的数字,代表的是当前分组的记录条数,最小和最大的槽指向 2个特殊的伪记录。有了槽之后,我们按照主键搜索页中记录时,就可以采用二分法快速搜索,无需从最小记录开始遍历整个页中记录链表。

举例:搜索主键(pk) = 15的记录
  • 先二分得出槽中间位是(0+6)/2=3 , 看到其指向的记录是 12 < 15 , 所以需要从 #3 槽后继续搜索;
  • 再使用二分搜索出 #3槽和 #6槽的中间位 (3+6)/2=4.5 取整4,#4槽对应的记录是 16 > 15,所以记录一定在#4槽中;
  • 在从 #3 槽指向的12号记录开始向下搜索3次,定位到15号记录。

聚簇索引和非聚簇索引

InnoDB中,表数据文件本身就是按B+Tree组织的一个索引结构,聚簇索引就是按照每张表的主键构造一颗B+树,同时叶子节点中存放的就是整张表的行记录数据,也将聚集索引的叶子节点称为数据页。这个特性决定了索引组织表中数据也是索引的一部分;

  一般建表会用一个自增主键做聚簇索引,没有的话MySQL会默认创建,但是这个主键如果更改代价较高,故建表时要考虑自增ID不能频繁update这点。

  我们日常工作中,根据实际情况自行添加的索引都是辅助索引,辅助索引就是一个为了需找主键索引的二级索引,现在找到主键索引再通过主键索引找数据;
在这里插入图片描述

B+ 树的特点包括:
: 最底层的节点叫作叶子节点,用来存放数据;
: 其他上层节点叫作非叶子节点,仅用来存放目录项,作为索引;
: 非叶子节点分为不同层次,通过分层来降低每一层的搜索量;
: 所有节点按照索引键大小排序,构成一个双向链表,加速范围查找。

  • 因此,InnoDB 使用 B+ 树,既可以保存实际数据,也可以加速数据搜索,这就是聚簇索
    引。如果把上图叶子节点下面方块中的省略号看作实际数据的话,那么它就是聚簇索引的示

意图。由于数据在物理上只会保存一份,所以包含实际数据的聚簇索引只能有一个。

  • InnoDB 会自动使用主键(唯一定义一条记录的单个或多个字段)作为聚簇索引的索引键
    (如果没有主键,就选择第一个不包含 NULL 值的唯一列)。上图方框中的数字代表了索

引键的值,对聚簇索引而言一般就是主键。

为了实现非主键字段的快速搜索,就引出了二级索引,也叫作非聚簇索引、辅助索引。二级索引,也是利用的 B + 数的数据结构
在这里插入图片描述

这次二级索引的叶子节点中保存的不是实际数据,而是主键,获得主键值后去聚簇索引中获
得数据行。这个过程就叫作回表。

回表是什么意思?就是你执行一条sql语句,需要从两个b+索引中去取数据

表tbl有a,b,c三个字段,其中a是主键,b上建了索引,然后编写sql语句

        SELECT * FROM tbl WHERE a=1

这样不会产生回表,因为所有的数据在a的索引树中均能找到

    SELECT * FROM tbl WHERE b=1

这样就会产生回表,因为where条件是b字段,那么会去b的索引树里查找数据,但b的索引里面只有a,b两个字段的值,没有c,那么这个查询为了取到c字段,就要取出主键a的值,然后去a的索引树去找c字段的数据。
查了两个索引树,这就叫回表。索引覆盖就是查这个索引能查到你所需要的所有数据,不需要去另外的数据结构去查。其实就是不用回表。


考虑额外创建二级索引的代价


创建二级索引的代价,主要表现在维护代价、空间代价和回表代价三个方面。

  • 维护代价:创建 N 个二级索引,就需要再创建 N 棵 B+ 树,新增数据时不仅要修改聚簇索引,还需要修改这 N 个二级索引。
  • 空间代价:虽然二级索引不保存原始数据,但要保存索引列的数据,所以会占用更多的空间
  • 回表代码:二级索引不保存原始数据,通过索引找到主键后需要再查询聚簇索引,才能得到我们想要的数据

不是所有针对索引列的查询都能用上索引

1. 索引只能匹配列前缀

比如下面的 LIKE 语句,搜索 name 后缀为 name123 的用户无法走索引,执行计划的 type=ALL 代表了全表扫描:

EXPLAIN SELECT * FROM person WHERE NAME LIKE '%name123' LIMIT 100

在这里插入图片描述

把百分号放到后面走前缀匹配,type=range 表示走索引扫描,key=name_score 看到实际走了索引

EXPLAIN SELECT * FROM person WHERE NAME LIKE 'name123%' LIMIT 100

在这里插入图片描述

2. 条件涉及函数操作无法走索引。

比如搜索条件用到了 LENGTH 函数,肯定无法走索引

EXPLAIN SELECT * FROM person WHERE LENGTH(NAME)=7

在这里插入图片描述

3.联合索引只能匹配左边的列

对 name 和 score 建了联合索引,但是仅按照 score 列搜索无法走索引

EXPLAIN SELECT * FROM person WHERE SCORE>45678

在这里插入图片描述
个人博客地址:http://blog.yanxiaolong.cn/

相关文章
|
2月前
|
数据库 索引
深入探索数据库索引技术:回表与索引下推解析
【10月更文挑战第15天】在数据库查询优化的领域中,回表和索引下推是两个核心概念,它们对于提高查询性能至关重要。本文将详细解释这两个术语,并探讨它们在数据库操作中的作用和影响。
60 3
|
2月前
|
数据库 索引
深入理解数据库索引技术:回表与索引下推详解
【10月更文挑战第23天】 在数据库查询性能优化中,索引的使用是提升查询效率的关键。然而,并非所有的索引都能直接加速查询。本文将深入探讨两个重要的数据库索引技术:回表和索引下推,解释它们的概念、工作原理以及对性能的影响。
85 3
|
29天前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因?
B+树优化了数据存储和查询效率,数据仅存于叶子节点,便于区间查询和遍历,磁盘读写成本低,查询效率稳定,特别适合数据库索引及范围查询。
38 6
|
2月前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因
B+树相较于B树,在数据存储、磁盘读写、查询效率及范围查询方面更具优势。数据仅存于叶子节点,便于高效遍历和区间查询;内部节点不含数据,提高缓存命中率;查询路径固定,效率稳定;特别适合数据库索引使用。
32 1
|
2月前
|
数据库 索引
数据库索引
数据库索引 1、索引:建立在表一列或多列的辅助对象,目的是加快访问表的数据。 2、索引的优点: (1)、创建唯一性索引,可以确保数据的唯一性; (2)、大大加快数据检索速度; (3)、加速表与表之间的连接; (4)、在查询过程中,使用优化隐藏器,提高系统性能。 3、索引的缺点: (1)、创建和维护索引需要耗费时间,随数据量增加而增加; (2)、索引占用物理空间; (3)、对表的数据进行增删改时,索引需要动态维护,降低了数据的维护速度。
40 2
|
3月前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
77 3
Mysql(4)—数据库索引
|
2月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
342 1
|
2月前
|
存储 关系型数据库 数据库
Postgres数据库BRIN索引介绍
BRIN索引是PostgreSQL提供的一种高效、轻量级的索引类型,特别适用于大规模、顺序数据的范围查询。通过存储数据块的摘要信息,BRIN索引在降低存储和维护成本的同时,提供了良好的查询性能。然而,其适用场景有限,不适合随机数据分布或频繁更新的场景。在选择索引类型时,需根据数据特性和查询需求进行权衡。希望本文对你理解和使用PostgreSQL的BRIN索引有所帮助。
59 0
|
2月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
131 0
|
3月前
|
关系型数据库 MySQL 数据库
深入浅出MySQL索引优化:提升数据库性能的关键
在这个数据驱动的时代,数据库性能的优劣直接关系到应用的响应速度和用户体验。MySQL作为广泛使用的数据库之一,其索引优化是提升查询性能的关键。本文将带你一探MySQL索引的内部机制,分析索引的类型及其适用场景,并通过实际案例演示如何诊断和优化索引,以实现数据库性能的飞跃。