《MySQL高级篇》四、索引的存储结构(二)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 《MySQL高级篇》四、索引的存储结构

3.3 常见索引概念


索引按照物理实现方式,索引可以分为 2 种:聚簇(聚集)和非聚簇(非聚集)索引。我们也把非聚集索引称为二级索引或者辅助索引。


3.3.1 聚簇索引


特点:


使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:

页内 的记录是按照主键的大小顺序排成一个 单向链表 。

各个存放存放 用户记录的页,也是根据页中用户记录的主键大小顺序排成一个 双向链表.

存放目录项记录的页分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表

B+ 树的叶子节点存储的是完整的用户记录。

所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。



优点:


数据访问更快 ,因为聚簇索引将索引和数据保存在同一个 B+ 树中,因此从聚簇索引中获取数据比非聚簇索引更快

聚簇索引对于主键的 排序查找 和 范围查找 速度非常快 (因为数据本身就是有序的)

按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以 节省了大量的 io 操作 。

缺点:


插入速度严重依赖于插入顺序 ,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于 InnoDB 表,我们一般都会定义一个 自增的 ID 列为主键

前半句分析。比如我们在上上幅图中页9和页20中间插入个 主键为200的数据,这就会导致页20及其后面的需要进行逻辑上的移动,然后插入新数据。同时上层目录页中的数据以及指针也可能变动,依次往上推,从而会降低性能!

后半句思考:删除的时候通常不真正删除,而是弄一个删除标记是不是和这个有关?

更新主键的代价很高 ,因为将会导致被更新的行移动。因此,对于 InnoDB 表,我们一般定义主键为不可更新

比如我们将 上上幅图 中的 209 改为 409,也会导致数据的移动。同时对上层目录页中的数据以及指针也可能变动,依次往上推,从而影响性能!

二级索引访问需要两次索引查找 ,第一次找到主键值,第二次根据主键值找到行数据 (下文细讲)

限制:


8758320fd4f3e74ae20bf5a7afa6ebd4.png


3.3.2 二级索引(辅助索引、非聚簇索引)


2725b62effee6b2647ac3cb4f77b54de.png


3cd0f068102aa3166519418e17b53132.png


f919f2da0450e6833d98453ce4d69db1.png

e8867b5b4c79836ade2fc2672930e8a7.png


概念:回表 我们根据这个以 c2 列大小排序的 B+ 树只能确定我们要查找记录的主键值,所以如果我们想根据 c2 列的值查找到完整的用户记录的话,仍然需要到 聚簇索引 中再查一遍,这个过程称为 回表 。也就是根据 c2 列的值查询一条完整的用户记录需要使用到 2 棵 B+ 树!


问题:为什么我们还需要一次回表操作呢?直接把完整的用户记录放到叶子节点不 OK 吗?


3ade35e2bae870d4321bfcabf12cbf07.png


b1d28acc3eddc1a8ddf1e78369b3b3de.png


7be520d8aed99573272f7283cc903509.png


第三点的解释:聚簇索引中存放的是记录的所有字段,一旦进行修改,聚簇索引上的数据是一定需要修改的。而非聚簇索引存放的是主键+单个字段,相对来说修改的少,效率也就高。


3.3.3 联合索引


我们也可以同时以多个列的大小作为排序规则,也就是同时为多个列建立索引,比方说我们想让 B+ 树按照 c2 和c3 列 的大小进行排序,这个包含两层含义:


先把各个记录和页按照 c2 列进行排序。

在记录的 c2 列相同的情况下,采用 c3 列进行排序


75994c1d0cf320ac2e293cdb5fdd15b6.png

c0aa9e808021d6c22ac89e6a358a3ac1.png


注意一点,以 c2 和 c3 列的大小为排序规则建立的 B+ 树称为 联合索引 ,本质上也是一个二级索引。它的意思与分别为 c2 和 c3 列分别建立索引的表述是不同的,不同点如下:


建立 联合索引 只会建立如上图一样的 1 棵 B+ 树。

为 c2 和 c3 列分别建立索引会分别以 c2 和 c3 列的大小为排序规则建立 2 棵 B+ 树。


3.4 InnoDB 的 B+ 树索引的注意事项


1. 根页面位置万年不动


689e8752037aef6e0277d2f06ff395b0.png


**注意:**B+树的构建是自上往下构建的


2. 内节点中目录项记录的唯一性


9d708a2dd2e31e7fbb3f9ccdfa74af40.png

712d09811245d6917e740922bf61543c.png

676e4ac217abdf6892de32e007b2bf34.png


400133e5f6091dc141bb8349ff4b3e96.png


400133e5f6091dc141bb8349ff4b3e96.png


注意: 页号虽然也可以保证列的唯一性,但是没有实际意义。而其他的列比如c3、c 4我们也不能保证唯一性。所以我们增添的是主键值,再进行判断时也是根据 列号+主键 来选择向哪一页插入数据


3. 一个页面最少存储 2 条记录


4093f49d99c923319239f28b27ea7b68.png


4. MyISAM 中的索引方案

B 树索引适用存储引擎如表所示:



索引 / 存储引擎 MyISAM InnoDB Memory
B-Tree 索引 支持 支持 支持


即使多个存储引擎支持同一种类型的索引,但是他们的实现原理也是不同的。Innodb 和 MyISAM 默认的索引是 B-tree 索引;而 Memory 默认的索引是 Hash 索引。


MyISAM 引擎使用 B+Tree 作为索引结构,叶子节点的 data 域存放的是 数据记录的地址 (所以MyISAM把索引和数据分开存储了)


注意: 在MySQL中,B 树实际上还是B+树。但是在选择谈到选择MySQL的数据结构时,这两者就区别大了


4.1 MyISAM 索引的原理


ff7440058b06311f0d07f764dd59ae7a.png


1500f2e17a229ce02eebf21d7c60d50c.png


205529e085ec705fba0b9f88112ebff4.png


e8f24932b53bd65dc7010ee2ae83b886.png


d5ffc24858cd593475dd9b63a6bdc107.png


注意: 对于MYISAM来说,无论是主键索引还是非主键索引都属于非聚簇索引,因为数据和索引是分离的


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
4月前
|
存储 SQL 关系型数据库
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
|
4月前
|
存储 关系型数据库 MySQL
MySQL数据库索引的数据结构?
MySQL中默认使用B+tree索引,它是一种多路平衡搜索树,具有树高较低、检索速度快的特点。所有数据存储在叶子节点,非叶子节点仅作索引,且叶子节点形成双向链表,便于区间查询。
162 4
|
4月前
|
存储 SQL 关系型数据库
MySQL 核心知识与索引优化全解析
本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分,阐述了 char 与 varchar 在存储方式和性能上的差异,以及事务的 ACID 特性、并发事务问题及对应的隔离级别(MySQL 默认 REPEATABLE READ)。 索引基础部分,详解了 InnoDB 默认的 B+tree 索引结构(多路平衡树、叶子节点存数据、双向链表支持区间查询),区分了聚簇索引(数据与索引共存,唯一)和二级索引(数据与索引分离,多个),解释了回表查询的概念及优化方法,并分析了 B+tree 作为索引结构的优势(树高低、效率稳、支持区间查询)。 索引优化部分,列出了索引创建的六大原则
124 2
|
5月前
|
存储 关系型数据库 MySQL
MySQL覆盖索引解释
总之,覆盖索引就像是图书馆中那些使得搜索变得极为迅速和简单的工具,一旦正确使用,就会让你的数据库查询飞快而轻便。让数据检索就像是读者在图书目录中以最快速度找到所需信息一样简便。这样的效率和速度,让覆盖索引成为数据库优化师傅们手中的尚方宝剑,既能够提升性能,又能够保持系统的整洁高效。
156 9
|
2月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
112 3
|
2月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
3月前
|
存储 运维 关系型数据库
从MySQL到云数据库,数据库迁移真的有必要吗?
本文探讨了企业在业务增长背景下,是否应从 MySQL 迁移至云数据库的决策问题。分析了 MySQL 的优势与瓶颈,对比了云数据库在存储计算分离、自动化运维、多负载支持等方面的优势,并提出判断迁移必要性的五个关键问题及实施路径,帮助企业理性决策并落地迁移方案。
|
2月前
|
关系型数据库 MySQL 分布式数据库
阿里云PolarDB云原生数据库收费价格:MySQL和PostgreSQL详细介绍
阿里云PolarDB兼容MySQL、PostgreSQL及Oracle语法,支持集中式与分布式架构。标准版2核4G年费1116元起,企业版最高性能达4核16G,支持HTAP与多级高可用,广泛应用于金融、政务、互联网等领域,TCO成本降低50%。
|
2月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
|
2月前
|
关系型数据库 分布式数据库 数据库
阿里云数据库收费价格:MySQL、PostgreSQL、SQL Server和MariaDB引擎费用整理
阿里云数据库提供多种类型,包括关系型与NoSQL,主流如PolarDB、RDS MySQL/PostgreSQL、Redis等。价格低至21元/月起,支持按需付费与优惠套餐,适用于各类应用场景。

热门文章

最新文章

推荐镜像

更多