MySQL中的索引

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: MySQL中的索引

一、概念

索引 翻译成英文:index下标

现有如下场景,有一张表是存放书的,我们如何查找其中的一本书?在数据库中,进行条件查找时,是要遍历数据的,时间复杂度虽然是O(N) , 但是数据库里的表里的数据是成千上万的,就要遍历很多次,查找的速度也就变慢了,那么我们如何能快速找到这表里我们想要的书呢?这时,就可以在数据库中引入索引,通过这个索引来快速找到我们想要的数据。

概念:索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。


二、作用和特点

作用

1、数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍内容和书籍目录的关系。

2、索引所起的作用类似书籍目录,可用于快速定位、检索数据。

3、索引对于提高数据库的性能有很大的帮助

 

特点

1、加快查询的速度。

2、索引自身是一定的数据结构,也要占据存储空间。

3、当我们进行新增、修改、删除的时候,也要针对其索引进行更新,会有额外的开销。


三、使用场景

1、对于存储空间要求不高(存储空间比较充裕)

2、应用场景中,查询的比较多,增加、修改和删除都不多。


四、使用

在MySQL中创建主键(primary key)、唯一约束(unique)、外键约束(foreign key)时,会自动创建对应的索引。’

1、查看索引

语法:show index from 表名;

先创建有两个表,如图:

查看这两表的索引

代码:

show index from class;
show index from student;

如图:

2、创建索引

语法:create index 索引名 on 表名(字段名);

例子:对student表里的name创建索引

代码:

create index index_student_name on student(name);

3、删除索引

语法:drop index 索引名 on 表名;

例子:删除student中name的索引

代码:

drop index index_student_name on student;


五、索引底层数据结构的实现

索引是通过额外的数据结构,来针对表里的数据进行重新组织

我们知道,在MySQL中查找的时候有时不只是单单找一个值,可以是有范围的数据,如加入比较运算符:"<",">","between ... and.."这时用hash表或者是二叉搜索树来查找就不是很合适了,因为他们找的都是一个具体的值,而不是范围

那么通过索引进行查找,数据要怎么存储,查找的速度才能比较快呢?

——针对索引,MySQL专门搞了一个数据结构,来存储索引的列的数据,名为B+树

我们想要了解B+树要先了解B树

B树(B-树)

概念:B树是一个N叉搜索树(要求是有序的),其实就是对二叉搜索树进行了扩展

一个节点有N个值,N个值这又划分了N + 1个区间,到下一个节点又是重复上一节点的步骤进行划分区间。

图展示:

如图:假设第一个节点有以下这些值,我们存放有以下值

那么我们可以划分为5个区间,小于30, 30~50,50~60,60~70,大于70,这五个区间下就可以放属于这五个区间的数据,如图:

第二层节点下面还能划分,具体有啥值就不写了,如图:

这样,我们可以查找某一个具体的值,也可以找一个范围而且在同样高度的树,能表示的元素也比二插搜索树多了很多;使用B树来查询的时候,比较次数要比二插搜索树要更多但是这里的关键在于,同一个节点的这些key值,都是一次硬盘IO就读出来了。

即使总的比较次数增加了,但是硬盘IO的次数减少了这里的一次硬盘IO相当于在内存中1w次比较

B+树

B+树是在B树对基础上,做出了改进

同样是N插搜索树,每个节点包含了多个key,N个key划分出N个区间,如图:

再往下

这时又有一个和B树不一样的操作,就是会把叶子节点连接起来,如图:

这样,我们每次查询一个数或者一个范围,都需要从根节点到叶子节点,再从叶子节点的去往后遍历连接起来的叶子节点,去找我们需要的值或者区间。

特点

1、N叉搜索树,每个节点包含N个key,N个key可以划分出N个区间。

2、每个节点的的N个key中,都会存在一个最大值(设定成最小值也一样)。

3、每个节点中的key(最大值),都会在子树中重复出现。

4、叶子节点用链式结构连接起来

重复出现的好处

1、所有数据都包含在叶子节点这一层中(数据全集)。如找id > 4 and id < 10,根据4找到相应的位置,再从这个位置往后找到10就可以了;如果没有这种链式结构,就可能要反复对树进行回溯查找,这样就很麻烦。

2、针对B+树的的查询的时间是稳定的。查询任何一个元素,都要从根节点查询到子节点,过程中经过的硬盘IO次数是一样的。

3、数据行只需在叶子节点中存储,其他非叶子节点只存储key即可。

比如学生表(id,name,score...)数据行,这些数据行存储到叶子节点即可,因此,非叶子节点只存储key,按照一个key有4个字节来计算,100w个key才4MB,而这些非叶子节点的数据可以缓存到内存中,这个时候就可以在查询的时候,只在内存中,比较了,大幅度减少硬盘IO的次数。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4月前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
386 66
|
3月前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
553 9
|
2月前
|
存储 关系型数据库 MySQL
MySQL索引学习笔记
本文深入探讨了MySQL数据库中慢查询分析的关键概念和技术手段。
303 80
|
26天前
|
缓存 算法 关系型数据库
MySQL底层概述—8.JOIN排序索引优化
本文主要介绍了MySQL中几种关键的优化技术和概念,包括Join算法原理、IN和EXISTS函数的使用场景、索引排序与额外排序(Using filesort)的区别及优化方法、以及单表和多表查询的索引优化策略。
MySQL底层概述—8.JOIN排序索引优化
|
1月前
|
SQL 存储 关系型数据库
MySQL原理简介—9.MySQL索引原理
本文详细介绍了MySQL索引的设计与使用原则,涵盖磁盘数据页的存储结构、页分裂机制、主键索引设计及查询过程、聚簇索引和二级索引的原理、B+树索引的维护、联合索引的使用规则、SQL排序和分组时如何利用索引、回表查询对性能的影响以及索引覆盖的概念。此外还讨论了索引设计的案例,包括如何处理where筛选和order by排序之间的冲突、低基数字段的处理方式、范围查询字段的位置安排,以及通过辅助索引来优化特定查询场景。总结了设计索引的原则,如尽量包含where、order by、group by中的字段,选择离散度高的字段作为索引,限制索引数量,并针对频繁查询的低基数字段进行特殊处理等。
MySQL原理简介—9.MySQL索引原理
|
1月前
|
存储 关系型数据库 MySQL
MySQL底层概述—6.索引原理
本文详细回顾了:索引原理、二叉查找树、平衡二叉树(AVL树)、红黑树、B-Tree、B+Tree、Hash索引、聚簇索引与非聚簇索引。
MySQL底层概述—6.索引原理
|
5月前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
2月前
|
SQL 存储 关系型数据库
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
127 22
 MySQL秘籍之索引与查询优化实战指南
|
2月前
|
存储 关系型数据库 MySQL
浅入浅出——MySQL索引
本文介绍了数据库索引的概念和各种索引结构,如哈希表、B+树、InnoDB引擎的索引运作原理等。还分享了覆盖索引、联合索引、最左前缀原则等优化技巧,以及如何避免索引误用,提高数据库性能。
|
2月前
|
存储 关系型数据库 MySQL
MySQL中为什么要使用索引合并(Index Merge)?
通过这些内容的详细介绍和实际案例分析,希望能帮助您深入理解索引合并及其在MySQL中的
186 10

相关产品

  • 云数据库 RDS MySQL 版