《MySQL高级篇》四、索引的存储结构(二)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 《MySQL高级篇》四、索引的存储结构

3.3 常见索引概念


索引按照物理实现方式,索引可以分为 2 种:聚簇(聚集)和非聚簇(非聚集)索引。我们也把非聚集索引称为二级索引或者辅助索引。


3.3.1 聚簇索引


特点:


使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:

页内 的记录是按照主键的大小顺序排成一个 单向链表 。

各个存放存放 用户记录的页,也是根据页中用户记录的主键大小顺序排成一个 双向链表.

存放目录项记录的页分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表

B+ 树的叶子节点存储的是完整的用户记录。

所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。



优点:


数据访问更快 ,因为聚簇索引将索引和数据保存在同一个 B+ 树中,因此从聚簇索引中获取数据比非聚簇索引更快

聚簇索引对于主键的 排序查找 和 范围查找 速度非常快 (因为数据本身就是有序的)

按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以 节省了大量的 io 操作 。

缺点:


插入速度严重依赖于插入顺序 ,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于 InnoDB 表,我们一般都会定义一个 自增的 ID 列为主键

前半句分析。比如我们在上上幅图中页9和页20中间插入个 主键为200的数据,这就会导致页20及其后面的需要进行逻辑上的移动,然后插入新数据。同时上层目录页中的数据以及指针也可能变动,依次往上推,从而会降低性能!

后半句思考:删除的时候通常不真正删除,而是弄一个删除标记是不是和这个有关?

更新主键的代价很高 ,因为将会导致被更新的行移动。因此,对于 InnoDB 表,我们一般定义主键为不可更新

比如我们将 上上幅图 中的 209 改为 409,也会导致数据的移动。同时对上层目录页中的数据以及指针也可能变动,依次往上推,从而影响性能!

二级索引访问需要两次索引查找 ,第一次找到主键值,第二次根据主键值找到行数据 (下文细讲)

限制:


8758320fd4f3e74ae20bf5a7afa6ebd4.png


3.3.2 二级索引(辅助索引、非聚簇索引)


2725b62effee6b2647ac3cb4f77b54de.png


3cd0f068102aa3166519418e17b53132.png


f919f2da0450e6833d98453ce4d69db1.png

e8867b5b4c79836ade2fc2672930e8a7.png


概念:回表 我们根据这个以 c2 列大小排序的 B+ 树只能确定我们要查找记录的主键值,所以如果我们想根据 c2 列的值查找到完整的用户记录的话,仍然需要到 聚簇索引 中再查一遍,这个过程称为 回表 。也就是根据 c2 列的值查询一条完整的用户记录需要使用到 2 棵 B+ 树!


问题:为什么我们还需要一次回表操作呢?直接把完整的用户记录放到叶子节点不 OK 吗?


3ade35e2bae870d4321bfcabf12cbf07.png


b1d28acc3eddc1a8ddf1e78369b3b3de.png


7be520d8aed99573272f7283cc903509.png


第三点的解释:聚簇索引中存放的是记录的所有字段,一旦进行修改,聚簇索引上的数据是一定需要修改的。而非聚簇索引存放的是主键+单个字段,相对来说修改的少,效率也就高。


3.3.3 联合索引


我们也可以同时以多个列的大小作为排序规则,也就是同时为多个列建立索引,比方说我们想让 B+ 树按照 c2 和c3 列 的大小进行排序,这个包含两层含义:


先把各个记录和页按照 c2 列进行排序。

在记录的 c2 列相同的情况下,采用 c3 列进行排序


75994c1d0cf320ac2e293cdb5fdd15b6.png

c0aa9e808021d6c22ac89e6a358a3ac1.png


注意一点,以 c2 和 c3 列的大小为排序规则建立的 B+ 树称为 联合索引 ,本质上也是一个二级索引。它的意思与分别为 c2 和 c3 列分别建立索引的表述是不同的,不同点如下:


建立 联合索引 只会建立如上图一样的 1 棵 B+ 树。

为 c2 和 c3 列分别建立索引会分别以 c2 和 c3 列的大小为排序规则建立 2 棵 B+ 树。


3.4 InnoDB 的 B+ 树索引的注意事项


1. 根页面位置万年不动


689e8752037aef6e0277d2f06ff395b0.png


**注意:**B+树的构建是自上往下构建的


2. 内节点中目录项记录的唯一性


9d708a2dd2e31e7fbb3f9ccdfa74af40.png

712d09811245d6917e740922bf61543c.png

676e4ac217abdf6892de32e007b2bf34.png


400133e5f6091dc141bb8349ff4b3e96.png


400133e5f6091dc141bb8349ff4b3e96.png


注意: 页号虽然也可以保证列的唯一性,但是没有实际意义。而其他的列比如c3、c 4我们也不能保证唯一性。所以我们增添的是主键值,再进行判断时也是根据 列号+主键 来选择向哪一页插入数据


3. 一个页面最少存储 2 条记录


4093f49d99c923319239f28b27ea7b68.png


4. MyISAM 中的索引方案

B 树索引适用存储引擎如表所示:



索引 / 存储引擎 MyISAM InnoDB Memory
B-Tree 索引 支持 支持 支持


即使多个存储引擎支持同一种类型的索引,但是他们的实现原理也是不同的。Innodb 和 MyISAM 默认的索引是 B-tree 索引;而 Memory 默认的索引是 Hash 索引。


MyISAM 引擎使用 B+Tree 作为索引结构,叶子节点的 data 域存放的是 数据记录的地址 (所以MyISAM把索引和数据分开存储了)


注意: 在MySQL中,B 树实际上还是B+树。但是在选择谈到选择MySQL的数据结构时,这两者就区别大了


4.1 MyISAM 索引的原理


ff7440058b06311f0d07f764dd59ae7a.png


1500f2e17a229ce02eebf21d7c60d50c.png


205529e085ec705fba0b9f88112ebff4.png


e8f24932b53bd65dc7010ee2ae83b886.png


d5ffc24858cd593475dd9b63a6bdc107.png


注意: 对于MYISAM来说,无论是主键索引还是非主键索引都属于非聚簇索引,因为数据和索引是分离的


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
1
3
0
29
分享
相关文章
Mysql的索引
MYSQL索引主要有 : 单列索引 , 组合索引和空间索引 , 用的比较多的就是单列索引和组合索引 , 空间索引我这边没有用到过 单列索引 : 在MYSQL数据库表的某一列上面创建的索引叫单列索引 , 单列索引又分为 ● 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。 ● 唯一索引:索引列中的值必须是唯一的,但是允许为空值 ● 主键索引:是一种特殊的唯一索引,不允许有空值 ● 全文索引: 只有在MyISAM引擎、InnoDB(5.6以后)上才能使⽤用,而且只能在CHAR,VARCHAR,TEXT类型字段上使⽤用全⽂文索引。
MySQL底层概述—8.JOIN排序索引优化
本文主要介绍了MySQL中几种关键的优化技术和概念,包括Join算法原理、IN和EXISTS函数的使用场景、索引排序与额外排序(Using filesort)的区别及优化方法、以及单表和多表查询的索引优化策略。
111 22
MySQL底层概述—8.JOIN排序索引优化
MySQL索引有哪些类型?
● 普通索引:最基本的索引,没有任何限制。 ● 唯一索引:索引列的值必须唯一,但可以有空值。可以创建组合索引,则列值的组合必须唯一。 ● 主键索引:是特殊的唯一索引,不可以有空值,且表中只存在一个该值。 ● 组合索引:多列值组成一个索引,用于组合搜索,效率高于索引合并。 ● 全文索引:对文本的内容进行分词,进行搜索。
MySQL底层概述—6.索引原理
本文详细回顾了:索引原理、二叉查找树、平衡二叉树(AVL树)、红黑树、B-Tree、B+Tree、Hash索引、聚簇索引与非聚簇索引。
103 11
MySQL底层概述—6.索引原理
数据管理服务DMS支持MySQL数据库的无锁结构变更
本文介绍了使用Sysbench准备2000万数据并进行全表字段更新的操作。通过DMS的无锁变更功能,可在不锁定表的情况下完成结构修改,避免了传统方法中可能产生的锁等待问题。具体步骤包括:准备数据、提交审批、执行变更及检查表结构,确保变更过程高效且不影响业务运行。
65 2
MySQL进阶突击系列(09)数据磁盘存储模型 | 一行数据怎么存?
文中详细介绍了MySQL数据库中一行数据在磁盘上的存储机制,包括表空间、段、区、页和行的具体结构,以及如何设计和优化行数据存储以提高性能。
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
docker拉取MySQL后数据库连接失败解决方案
通过以上方法,可以解决Docker中拉取MySQL镜像后数据库连接失败的常见问题。关键步骤包括确保容器正确启动、配置正确的环境变量、合理设置网络和权限,以及检查主机防火墙设置等。通过逐步排查,可以快速定位并解决连接问题,确保MySQL服务的正常使用。
126 82
缓存与数据库的一致性方案,Redis与Mysql一致性方案,大厂P8的终极方案(图解+秒懂+史上最全)
缓存与数据库的一致性方案,Redis与Mysql一致性方案,大厂P8的终极方案(图解+秒懂+史上最全)