《MySQL高级篇》四、索引的存储结构(二)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 《MySQL高级篇》四、索引的存储结构

3.3 常见索引概念


索引按照物理实现方式,索引可以分为 2 种:聚簇(聚集)和非聚簇(非聚集)索引。我们也把非聚集索引称为二级索引或者辅助索引。


3.3.1 聚簇索引


特点:


使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:

页内 的记录是按照主键的大小顺序排成一个 单向链表 。

各个存放存放 用户记录的页,也是根据页中用户记录的主键大小顺序排成一个 双向链表.

存放目录项记录的页分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表

B+ 树的叶子节点存储的是完整的用户记录。

所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。



优点:


数据访问更快 ,因为聚簇索引将索引和数据保存在同一个 B+ 树中,因此从聚簇索引中获取数据比非聚簇索引更快

聚簇索引对于主键的 排序查找 和 范围查找 速度非常快 (因为数据本身就是有序的)

按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以 节省了大量的 io 操作 。

缺点:


插入速度严重依赖于插入顺序 ,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于 InnoDB 表,我们一般都会定义一个 自增的 ID 列为主键

前半句分析。比如我们在上上幅图中页9和页20中间插入个 主键为200的数据,这就会导致页20及其后面的需要进行逻辑上的移动,然后插入新数据。同时上层目录页中的数据以及指针也可能变动,依次往上推,从而会降低性能!

后半句思考:删除的时候通常不真正删除,而是弄一个删除标记是不是和这个有关?

更新主键的代价很高 ,因为将会导致被更新的行移动。因此,对于 InnoDB 表,我们一般定义主键为不可更新

比如我们将 上上幅图 中的 209 改为 409,也会导致数据的移动。同时对上层目录页中的数据以及指针也可能变动,依次往上推,从而影响性能!

二级索引访问需要两次索引查找 ,第一次找到主键值,第二次根据主键值找到行数据 (下文细讲)

限制:


8758320fd4f3e74ae20bf5a7afa6ebd4.png


3.3.2 二级索引(辅助索引、非聚簇索引)


2725b62effee6b2647ac3cb4f77b54de.png


3cd0f068102aa3166519418e17b53132.png


f919f2da0450e6833d98453ce4d69db1.png

e8867b5b4c79836ade2fc2672930e8a7.png


概念:回表 我们根据这个以 c2 列大小排序的 B+ 树只能确定我们要查找记录的主键值,所以如果我们想根据 c2 列的值查找到完整的用户记录的话,仍然需要到 聚簇索引 中再查一遍,这个过程称为 回表 。也就是根据 c2 列的值查询一条完整的用户记录需要使用到 2 棵 B+ 树!


问题:为什么我们还需要一次回表操作呢?直接把完整的用户记录放到叶子节点不 OK 吗?


3ade35e2bae870d4321bfcabf12cbf07.png


b1d28acc3eddc1a8ddf1e78369b3b3de.png


7be520d8aed99573272f7283cc903509.png


第三点的解释:聚簇索引中存放的是记录的所有字段,一旦进行修改,聚簇索引上的数据是一定需要修改的。而非聚簇索引存放的是主键+单个字段,相对来说修改的少,效率也就高。


3.3.3 联合索引


我们也可以同时以多个列的大小作为排序规则,也就是同时为多个列建立索引,比方说我们想让 B+ 树按照 c2 和c3 列 的大小进行排序,这个包含两层含义:


先把各个记录和页按照 c2 列进行排序。

在记录的 c2 列相同的情况下,采用 c3 列进行排序


75994c1d0cf320ac2e293cdb5fdd15b6.png

c0aa9e808021d6c22ac89e6a358a3ac1.png


注意一点,以 c2 和 c3 列的大小为排序规则建立的 B+ 树称为 联合索引 ,本质上也是一个二级索引。它的意思与分别为 c2 和 c3 列分别建立索引的表述是不同的,不同点如下:


建立 联合索引 只会建立如上图一样的 1 棵 B+ 树。

为 c2 和 c3 列分别建立索引会分别以 c2 和 c3 列的大小为排序规则建立 2 棵 B+ 树。


3.4 InnoDB 的 B+ 树索引的注意事项


1. 根页面位置万年不动


689e8752037aef6e0277d2f06ff395b0.png


**注意:**B+树的构建是自上往下构建的


2. 内节点中目录项记录的唯一性


9d708a2dd2e31e7fbb3f9ccdfa74af40.png

712d09811245d6917e740922bf61543c.png

676e4ac217abdf6892de32e007b2bf34.png


400133e5f6091dc141bb8349ff4b3e96.png


400133e5f6091dc141bb8349ff4b3e96.png


注意: 页号虽然也可以保证列的唯一性,但是没有实际意义。而其他的列比如c3、c 4我们也不能保证唯一性。所以我们增添的是主键值,再进行判断时也是根据 列号+主键 来选择向哪一页插入数据


3. 一个页面最少存储 2 条记录


4093f49d99c923319239f28b27ea7b68.png


4. MyISAM 中的索引方案

B 树索引适用存储引擎如表所示:



索引 / 存储引擎 MyISAM InnoDB Memory
B-Tree 索引 支持 支持 支持


即使多个存储引擎支持同一种类型的索引,但是他们的实现原理也是不同的。Innodb 和 MyISAM 默认的索引是 B-tree 索引;而 Memory 默认的索引是 Hash 索引。


MyISAM 引擎使用 B+Tree 作为索引结构,叶子节点的 data 域存放的是 数据记录的地址 (所以MyISAM把索引和数据分开存储了)


注意: 在MySQL中,B 树实际上还是B+树。但是在选择谈到选择MySQL的数据结构时,这两者就区别大了


4.1 MyISAM 索引的原理


ff7440058b06311f0d07f764dd59ae7a.png


1500f2e17a229ce02eebf21d7c60d50c.png


205529e085ec705fba0b9f88112ebff4.png


e8f24932b53bd65dc7010ee2ae83b886.png


d5ffc24858cd593475dd9b63a6bdc107.png


注意: 对于MYISAM来说,无论是主键索引还是非主键索引都属于非聚簇索引,因为数据和索引是分离的


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
24天前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
|
2天前
|
存储 关系型数据库 MySQL
Mysql索引:深入理解InnoDb聚集索引与MyisAm非聚集索引
通过本文的介绍,希望您能深入理解InnoDB聚集索引与MyISAM非聚集索引的概念、结构和应用场景,从而在实际工作中灵活运用这些知识,优化数据库性能。
29 7
|
18天前
|
关系型数据库 MySQL Java
MySQL索引优化与Java应用实践
【11月更文挑战第25天】在大数据量和高并发的业务场景下,MySQL数据库的索引优化是提升查询性能的关键。本文将深入探讨MySQL索引的多种类型、优化策略及其在Java应用中的实践,通过历史背景、业务场景、底层原理的介绍,并结合Java示例代码,帮助Java架构师更好地理解并应用这些技术。
22 2
|
1月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
200 1
|
3天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
50 15
|
4天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
8天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
16天前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
28天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
35 1
|
1月前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
39 4

热门文章

最新文章