MySQL索引原理

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 正确的创建合适的索引是数据库性能优化的基础。

索引是关系型数据库中为了加速对表中行数据检索的数据结构。索引是存在硬盘中的,不是内存中,因此索引占的空间比较大。如果没有索引,数据库全表扫描,逐一比对的话,时间复杂度是O(n),所以要合理创建索引。

哈希索引

底层是数组+链表或红黑树的结构,时间复杂度为O(1)。在进行等值比较时非常高效,哈希取值后不能比大小,所以不支持范围查找。
注:Innodb存储引擎不支持用户级别的哈希索引。

树形索引

底层是二分的递归查找法,左小右大的排列。
二叉树结构大大减小查询范围,根节点是第一个插入的元素,如果是自增的序列,就会变成一个线性的链表结构,相当于遍历一遍了,效率极低,所以被淘汰了。
平衡二叉树是相对平衡的树,解决了线性链表的问题,作为索引,每查询一层树,增加一次io,数据太多,io次数过多,影响磁盘性能,io利用率低(单次io能真正使用到的内容的占比),不能够满足操作系统跟磁盘的交互特性。
多路平衡查找树(B-Tree)一个节点可以有n个子节点,完全平衡的树,左右的叶子节点都在一个水平线上,n个关键字对应n+1个子节点,节点固定在16KB大小,存储int数据时,第一层可以存储1000条数据,第二层1000×1001条,基于MySQL发出的io请求都是4×操作系统页的大小,io次数为3次-4次,io利用率是16kb,很好的满足操作系统跟磁盘的交互特性。
Picture1.png
注意:在多变的列上面不要创建索引,会引发树的多次平衡。

 在MySQL、Oracle的官方网站中建议用自增序列作为主键,那为什么身份证号码,手机号码不行?采用主键作为索引的话,在树的调整阶段,带来的影响小,只影响最右边的相关元素,树的结构的调整相对小。

MySQL索引机制是B+Tree,为什么不用b-tree?
B+Tree关键字:子节点=1:1,在根节点和子节点没有数据区的内容,只有最末尾的叶子节点有,在最末尾的叶子节点形成了天然的双向链表结构,在排序和范围查找有好处。

Picture2.png

采用的数据布局和搜索方式是左闭合的方式,例如
X=1 ->  1 <=X<28 -> P1
X=28 -> 28<=X<66 -> P2
X=66 -> 66<=X    -> P3
X=-1,直接跳过判断,不会进入搜索过程

MySQL中的B+Tree每一次搜索都会到达叶子节点结束,叶子节点才有数据区,才能返回对应内容,根节点和支节点都没有数据区,单个节点的关键字会更多,io能力强于B-Tree结构。B+Tree有排序,适合范围查找。而且查询稳定,稳定的n次的io操作。基于索引进行数据全量扫描,B+Tree强于B-Tree,只需要扫描叶子节点就可以了,不需要把所有节点全部扫描一遍。

索引与离散度

索引选择离散度高的列,如果选择了重复度高的列,创建索引,比如性别,索引是为了做数据的大范围过滤的,唯一确定性不够,可能一半以上都满足条件,不如直接全表扫描。
离散度超过15%会强制不走索引,进行全表扫描。当离散度超过该值的情况下全表扫描可能反倒比索引扫描更有效。我们所追求的目标就是创建全表扫描所无法比拟的有效索引。
Picture3.png
离散性计算公式:count(distinct col) : count(col)
比值越高离散性越好,列的选择性就越好,选择性好的列作为索引更合适,离散性很差的列作为索引可能适得其反。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2天前
|
存储 关系型数据库 MySQL
MySQL基础:索引
MySQL中的索引是一种数据结构,能大幅提升数据库查询效率和减少I/O成本,类似于书的目录帮助快速定位内容。其优势包括提高检索效率和降低排序成本,但会占用空间并影响更新表的效率。鉴于查询远多于更新,索引仍被推荐使用。索引分为多种类型,如B+树和哈希索引,其中B+树因其较低的高度和稳定的查询开销成为常用选择。创建和删除索引需谨慎,以免影响性能。
20 4
MySQL基础:索引
|
14天前
|
SQL 关系型数据库 MySQL
说一下MySQL主从复制的原理?
【8月更文挑战第24天】说一下MySQL主从复制的原理?
41 0
|
18天前
|
缓存 关系型数据库 MySQL
在Linux中,如何优化MySQL性能,包括索引优化和查询分析?
在Linux中,如何优化MySQL性能,包括索引优化和查询分析?
|
18天前
|
SQL 关系型数据库 MySQL
MySQL索引你用对了吗?
本文从遇到的问题出发,分析了tddl优化器、MySQL索引、分表拆分键的选择相关知识。
|
18天前
|
SQL 关系型数据库 MySQL
Mysql原理与调优-事务与MVCC
【8月更文挑战第19天】
|
19天前
|
存储 关系型数据库 MySQL
MySQL bit类型增加索引后查询结果不正确案例浅析
【8月更文挑战第17天】在MySQL中,`BIT`类型字段在添加索引后可能出现查询结果异常。表现为查询结果与预期不符,如返回错误记录或遗漏部分数据。原因包括索引使用不当、数据存储及比较问题,以及索引创建时未充分考虑`BIT`特性。解决方法涉及正确运用索引、理解`BIT`的存储和比较机制,以及合理创建索引以覆盖各种查询条件。通过`EXPLAIN`分析执行计划可帮助诊断和优化查询。
|
22天前
|
SQL 存储 关系型数据库
mysql加索引真的会锁表吗?揭秘背后的技术细节与规避策略
【8月更文挑战第16天】在数据库管理中,添加索引能大幅提升查询效率。MySQL执行此操作时的锁定行为常引起关注。文章详细解析MySQL中索引添加时的锁定机制及其原理。不同存储引擎及SQL语句影响锁定策略:MyISAM需全表锁定;InnoDB提供更灵活选项,如使用`ALTER TABLE... LOCK=NONE`可在加索引时允许读写访问,尽管可能延长索引构建时间。自MySQL 5.6起,在线DDL技术可进一步减少锁定时间,通过`ALGORITHM=INPLACE`和`LOCK=NONE`实现近乎无锁的表结构变更。合理配置这些选项有助于最小化对业务的影响并保持数据库高效运行。
51 4
|
22天前
|
存储 SQL 关系型数据库
深入MySQL锁机制:原理、死锁解决及Java防范技巧
深入MySQL锁机制:原理、死锁解决及Java防范技巧
|
7天前
|
SQL 关系型数据库 MySQL
SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
63 0
|
8天前
|
SQL 关系型数据库 MySQL
深入探索MySQL索引策略
本文旨在深入探讨MySQL(8.0.26)数据库中索引的设计与优化方法。

热门文章

最新文章

下一篇
DDNS