MySQL学习笔记-主键索引和二级索引

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL学习笔记-主键索引和二级索引

实现索引的的方式有很多,可以用于提高读写效率的数据结构也很多,常见的数据结构有哈希表、有序数组、搜索树MySQL 索引是为了提高查询效率的,MySQL 中的索引又分为主键索引二级索引,了解了 MySQL 的索引模型之后,可以帮助对索引的理解,这篇文章就来学习一下 MySQL索引模型

1.笔记图

2.索引的常见模型


  • 哈希表
  • 哈希表是一种以键-值(key-value)存储数据的结构,把值放在数组里,用一个哈希函数把 key 转化为整数,然后取模计算得到一个索引位置,然后把 value 放在数组的这个位置
  • 多个 key 值经过哈希函数的换算,会出现同一个值的情况,这总情况称为哈希冲突,处理这种情况通常可以拉出一个链表
  • 哈希表这种结构适用于只有等值查询的场景,因为不是有序的,所以哈希索引做区间查询的速度是很慢的
  • 有序数组
  • 如果仅仅看查询效率,有序数组就是最好的数据结构了
  • 但是在需要更新数据的时候,往中间插入一个记录就必须得挪动后面所有的记录,成本太高
  • 搜索树
  • 二叉搜索树的父节点左子树所有结点的值小于父节点的值,右子树所有结点的值大于父节点的值
  • 当然为了维持 O(log(N)) 的查询复杂度,你就需要保持这棵树是平衡二叉树。为了做这个保证,更新的时间复杂度也是 O(log(N))
  • 为了让一个查询尽量少地读磁盘,就必须让查询过程访问尽量少的数据块,要使用 N 叉树

3.InnoDB 的索引模型

  • InnoDB 中,表都是根据主键顺序以索引的形式存放的,这种存储方式的表称为索引组织表
  • InnoDB 使用了 B+ 树索引模型,所以数据都是存储在 B+ 树中的
  • 每一个索引在 InnoDB 里面对应一棵 B+
  • 页分裂
  • 如果插入新的行 ID 值为 700,则只需要在 R5 的记录后面插入一个新记录
  • 如果新插入的 ID 值为 400,需要逻辑上挪动后面的数据,空出位置
  • 如果 R5 所在的数据页已经满了,根据 B+ 树的算法,这时候需要申请一个新的数据页,然后挪动部分数据过去,这个过程称为页分裂,性能会受到影响
  • 页分裂操作还影响数据页的利用率,原本放在一个页的数据,现在分到两个页中,整体空间利用率降低大约 50%
  • 页合并:当相邻两个页由于删除了数据,利用率很低之后,会将数据页做合并

4.主键索引和普通索引查询的区别

  • 主键查询方式,则只需要搜索 ID 这棵 B+
select * from T where ID=500
  • 普通索引查询方式,需要先搜索 k 索引树,得到 ID 的值 500,再到 ID 索引树搜索一次,这个过程称为回表
select * from T where k=5
  • 非主键索引的查询需要多扫描一棵索引树,在应用中应该尽量使用主键查询

5.如何选择主键字段

  • 每个非主键索引的叶子节点上都是主键的值
  • 主键长度越小,普通索引的叶子节点就越小,普通索引占用的空间也就越小
  • 从性能和存储空间方面考量,自增主键往往是更合理的选择

6.笔记图

7.回表过程


select * from T where k between 3 and 5
  • k 索引树上找到 k=3 的记录,取得 ID = 300
  • 再到 ID 索引树查到 ID=300 对应的 R3
  • k 索引树取下一个值 k=5,取得 ID=500
  • 再回到 ID 索引树查到 ID=500 对应的 R4
  • k 索引树取下一个值 k=6,不满足条件,循环结束
  • 这个过程中,回到主键索引树搜索的过程称为回表
  • 覆盖索引
  • 如果执行的语句是 select ID from T where k between 3 and 5,只需要查 ID 的值,而 ID 的值已经在 k 索引树上,因此可以直接提供查询结果,不需要回表,索引 k 已经 覆盖了 查询需求,称为覆盖索引
  • 由于覆盖索引可以减少树的搜索次数,显著提升查询性能,所以使用覆盖索引是一个常用的性能优化手段
  • 索引下推

  • select * from tuser where name like ‘张%’ and age=10 and ismale=1
  • MySQL 5.6 引入的索引下推优化(index condition pushdown), 可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数

8.最左前缀原则

  • B+ 树这种索引结构,可以利用索引的 最左前缀,来定位记录
  • 举例
  • (name,age)这个联合索引来分析
  • 索引项是按照索引定义里面出现的字段顺序排序的
  • 当你的逻辑需求是查到所有名字是 张三 的人时,可以快速定位到 ID4,然后向后遍历得到所有需要的结果
  • 如果要查的是名字第一个字是 的人,SQL 语句条件是 where name like ‘张 %’,查找到第一个符合的记录是 ID3,然后向后遍历,直到不满足条件为止
  • 只要满足最左前缀,就可以利用索引来加速检索,可以是联合索引的最左 N 个字段,也可以是字符串索引的最左 M 个字符


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
5天前
|
关系型数据库 MySQL 数据库
Mysql的索引
MYSQL索引主要有 : 单列索引 , 组合索引和空间索引 , 用的比较多的就是单列索引和组合索引 , 空间索引我这边没有用到过 单列索引 : 在MYSQL数据库表的某一列上面创建的索引叫单列索引 , 单列索引又分为 ● 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。 ● 唯一索引:索引列中的值必须是唯一的,但是允许为空值 ● 主键索引:是一种特殊的唯一索引,不允许有空值 ● 全文索引: 只有在MyISAM引擎、InnoDB(5.6以后)上才能使⽤用,而且只能在CHAR,VARCHAR,TEXT类型字段上使⽤用全⽂文索引。
|
2月前
|
存储 关系型数据库 MySQL
MySQL索引学习笔记
本文深入探讨了MySQL数据库中慢查询分析的关键概念和技术手段。
317 80
|
1月前
|
缓存 算法 关系型数据库
MySQL底层概述—8.JOIN排序索引优化
本文主要介绍了MySQL中几种关键的优化技术和概念,包括Join算法原理、IN和EXISTS函数的使用场景、索引排序与额外排序(Using filesort)的区别及优化方法、以及单表和多表查询的索引优化策略。
109 22
MySQL底层概述—8.JOIN排序索引优化
|
5天前
|
自然语言处理 关系型数据库 MySQL
MySQL索引有哪些类型?
● 普通索引:最基本的索引,没有任何限制。 ● 唯一索引:索引列的值必须唯一,但可以有空值。可以创建组合索引,则列值的组合必须唯一。 ● 主键索引:是特殊的唯一索引,不可以有空值,且表中只存在一个该值。 ● 组合索引:多列值组成一个索引,用于组合搜索,效率高于索引合并。 ● 全文索引:对文本的内容进行分词,进行搜索。
|
1月前
|
SQL 存储 关系型数据库
MySQL原理简介—9.MySQL索引原理
本文详细介绍了MySQL索引的设计与使用原则,涵盖磁盘数据页的存储结构、页分裂机制、主键索引设计及查询过程、聚簇索引和二级索引的原理、B+树索引的维护、联合索引的使用规则、SQL排序和分组时如何利用索引、回表查询对性能的影响以及索引覆盖的概念。此外还讨论了索引设计的案例,包括如何处理where筛选和order by排序之间的冲突、低基数字段的处理方式、范围查询字段的位置安排,以及通过辅助索引来优化特定查询场景。总结了设计索引的原则,如尽量包含where、order by、group by中的字段,选择离散度高的字段作为索引,限制索引数量,并针对频繁查询的低基数字段进行特殊处理等。
MySQL原理简介—9.MySQL索引原理
|
1月前
|
存储 关系型数据库 MySQL
MySQL底层概述—6.索引原理
本文详细回顾了:索引原理、二叉查找树、平衡二叉树(AVL树)、红黑树、B-Tree、B+Tree、Hash索引、聚簇索引与非聚簇索引。
MySQL底层概述—6.索引原理
|
2月前
|
SQL 存储 关系型数据库
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
137 22
 MySQL秘籍之索引与查询优化实战指南
|
2月前
|
存储 关系型数据库 MySQL
浅入浅出——MySQL索引
本文介绍了数据库索引的概念和各种索引结构,如哈希表、B+树、InnoDB引擎的索引运作原理等。还分享了覆盖索引、联合索引、最左前缀原则等优化技巧,以及如何避免索引误用,提高数据库性能。
|
2月前
|
存储 关系型数据库 MySQL
MySQL中为什么要使用索引合并(Index Merge)?
通过这些内容的详细介绍和实际案例分析,希望能帮助您深入理解索引合并及其在MySQL中的
200 10
|
6天前
|
关系型数据库 MySQL 数据库连接
docker拉取MySQL后数据库连接失败解决方案
通过以上方法,可以解决Docker中拉取MySQL镜像后数据库连接失败的常见问题。关键步骤包括确保容器正确启动、配置正确的环境变量、合理设置网络和权限,以及检查主机防火墙设置等。通过逐步排查,可以快速定位并解决连接问题,确保MySQL服务的正常使用。
114 82