MySQL中的索引

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: MySQL中的索引

一、概念

索引 翻译成英文:index下标

现有如下场景,有一张表是存放书的,我们如何查找其中的一本书?在数据库中,进行条件查找时,是要遍历数据的,时间复杂度虽然是O(N) , 但是数据库里的表里的数据是成千上万的,就要遍历很多次,查找的速度也就变慢了,那么我们如何能快速找到这表里我们想要的书呢?这时,就可以在数据库中引入索引,通过这个索引来快速找到我们想要的数据。

概念:索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。


二、作用和特点

作用

1、数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍内容和书籍目录的关系。

2、索引所起的作用类似书籍目录,可用于快速定位、检索数据。

3、索引对于提高数据库的性能有很大的帮助

 

特点

1、加快查询的速度。

2、索引自身是一定的数据结构,也要占据存储空间。

3、当我们进行新增、修改、删除的时候,也要针对其索引进行更新,会有额外的开销。


三、使用场景

1、对于存储空间要求不高(存储空间比较充裕)

2、应用场景中,查询的比较多,增加、修改和删除都不多。


四、使用

在MySQL中创建主键(primary key)、唯一约束(unique)、外键约束(foreign key)时,会自动创建对应的索引。’

1、查看索引

语法:show index from 表名;

先创建有两个表,如图:

查看这两表的索引

代码:

show index from class;
show index from student;

如图:

2、创建索引

语法:create index 索引名 on 表名(字段名);

例子:对student表里的name创建索引

代码:

create index index_student_name on student(name);

3、删除索引

语法:drop index 索引名 on 表名;

例子:删除student中name的索引

代码:

drop index index_student_name on student;


五、索引底层数据结构的实现

索引是通过额外的数据结构,来针对表里的数据进行重新组织

我们知道,在MySQL中查找的时候有时不只是单单找一个值,可以是有范围的数据,如加入比较运算符:"<",">","between ... and.."这时用hash表或者是二叉搜索树来查找就不是很合适了,因为他们找的都是一个具体的值,而不是范围

那么通过索引进行查找,数据要怎么存储,查找的速度才能比较快呢?

——针对索引,MySQL专门搞了一个数据结构,来存储索引的列的数据,名为B+树

我们想要了解B+树要先了解B树

B树(B-树)

概念:B树是一个N叉搜索树(要求是有序的),其实就是对二叉搜索树进行了扩展

一个节点有N个值,N个值这又划分了N + 1个区间,到下一个节点又是重复上一节点的步骤进行划分区间。

图展示:

如图:假设第一个节点有以下这些值,我们存放有以下值

那么我们可以划分为5个区间,小于30, 30~50,50~60,60~70,大于70,这五个区间下就可以放属于这五个区间的数据,如图:

第二层节点下面还能划分,具体有啥值就不写了,如图:

这样,我们可以查找某一个具体的值,也可以找一个范围而且在同样高度的树,能表示的元素也比二插搜索树多了很多;使用B树来查询的时候,比较次数要比二插搜索树要更多但是这里的关键在于,同一个节点的这些key值,都是一次硬盘IO就读出来了。

即使总的比较次数增加了,但是硬盘IO的次数减少了这里的一次硬盘IO相当于在内存中1w次比较

B+树

B+树是在B树对基础上,做出了改进

同样是N插搜索树,每个节点包含了多个key,N个key划分出N个区间,如图:

再往下

这时又有一个和B树不一样的操作,就是会把叶子节点连接起来,如图:

这样,我们每次查询一个数或者一个范围,都需要从根节点到叶子节点,再从叶子节点的去往后遍历连接起来的叶子节点,去找我们需要的值或者区间。

特点

1、N叉搜索树,每个节点包含N个key,N个key可以划分出N个区间。

2、每个节点的的N个key中,都会存在一个最大值(设定成最小值也一样)。

3、每个节点中的key(最大值),都会在子树中重复出现。

4、叶子节点用链式结构连接起来

重复出现的好处

1、所有数据都包含在叶子节点这一层中(数据全集)。如找id > 4 and id < 10,根据4找到相应的位置,再从这个位置往后找到10就可以了;如果没有这种链式结构,就可能要反复对树进行回溯查找,这样就很麻烦。

2、针对B+树的的查询的时间是稳定的。查询任何一个元素,都要从根节点查询到子节点,过程中经过的硬盘IO次数是一样的。

3、数据行只需在叶子节点中存储,其他非叶子节点只存储key即可。

比如学生表(id,name,score...)数据行,这些数据行存储到叶子节点即可,因此,非叶子节点只存储key,按照一个key有4个字节来计算,100w个key才4MB,而这些非叶子节点的数据可以缓存到内存中,这个时候就可以在查询的时候,只在内存中,比较了,大幅度减少硬盘IO的次数。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
6月前
|
存储 SQL 关系型数据库
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
|
6月前
|
存储 关系型数据库 MySQL
MySQL数据库索引的数据结构?
MySQL中默认使用B+tree索引,它是一种多路平衡搜索树,具有树高较低、检索速度快的特点。所有数据存储在叶子节点,非叶子节点仅作索引,且叶子节点形成双向链表,便于区间查询。
214 4
|
8月前
|
存储 关系型数据库 MySQL
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
|
10月前
|
关系型数据库 MySQL 数据库
Mysql的索引
MYSQL索引主要有 : 单列索引 , 组合索引和空间索引 , 用的比较多的就是单列索引和组合索引 , 空间索引我这边没有用到过 单列索引 : 在MYSQL数据库表的某一列上面创建的索引叫单列索引 , 单列索引又分为 ● 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。 ● 唯一索引:索引列中的值必须是唯一的,但是允许为空值 ● 主键索引:是一种特殊的唯一索引,不允许有空值 ● 全文索引: 只有在MyISAM引擎、InnoDB(5.6以后)上才能使⽤用,而且只能在CHAR,VARCHAR,TEXT类型字段上使⽤用全⽂文索引。
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
2820 10
|
6月前
|
存储 SQL 关系型数据库
MySQL 核心知识与索引优化全解析
本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分,阐述了 char 与 varchar 在存储方式和性能上的差异,以及事务的 ACID 特性、并发事务问题及对应的隔离级别(MySQL 默认 REPEATABLE READ)。 索引基础部分,详解了 InnoDB 默认的 B+tree 索引结构(多路平衡树、叶子节点存数据、双向链表支持区间查询),区分了聚簇索引(数据与索引共存,唯一)和二级索引(数据与索引分离,多个),解释了回表查询的概念及优化方法,并分析了 B+tree 作为索引结构的优势(树高低、效率稳、支持区间查询)。 索引优化部分,列出了索引创建的六大原则
170 2
|
7月前
|
存储 关系型数据库 MySQL
MySQL覆盖索引解释
总之,覆盖索引就像是图书馆中那些使得搜索变得极为迅速和简单的工具,一旦正确使用,就会让你的数据库查询飞快而轻便。让数据检索就像是读者在图书目录中以最快速度找到所需信息一样简便。这样的效率和速度,让覆盖索引成为数据库优化师傅们手中的尚方宝剑,既能够提升性能,又能够保持系统的整洁高效。
202 9
|
8月前
|
机器学习/深度学习 关系型数据库 MySQL
对比MySQL全文索引与常规索引的互异性
现在,你或许明白了这两种索引的差异,但任何技术决策都不应仅仅基于理论之上。你可以创建你的数据库实验环境,尝试不同类型的索引,看看它们如何影响性能,感受它们真实的力量。只有这样,你才能熟悉它们,掌握什么时候使用全文索引,什么时候使用常规索引,以适应复杂多变的业务需求。
229 12
|
存储 关系型数据库 MySQL
MySQL索引学习笔记
本文深入探讨了MySQL数据库中慢查询分析的关键概念和技术手段。
786 81
|
9月前
|
SQL 存储 关系型数据库
MySQL选错索引了怎么办?
本文探讨了MySQL中因索引选择不当导致查询性能下降的问题。通过创建包含10万行数据的表并插入数据,分析了一条简单SQL语句在不同场景下的执行情况。实验表明,当数据频繁更新时,MySQL可能因统计信息不准确而选错索引,导致全表扫描。文章深入解析了优化器判断扫描行数的机制,指出基数统计误差是主要原因,并提供了通过`analyze table`重新统计索引信息的解决方法。
276 3

相关产品

  • 云数据库 RDS MySQL 版
  • 推荐镜像

    更多