【MySQL实战笔记】 04 | 深入浅出索引(上)-02

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 【4月更文挑战第9天】InnoDB数据库使用B+树作为索引模型,其中主键索引的叶子节点存储完整行数据,非主键索引则存储主键值。主键查询只需搜索一棵树,而非主键查询需两次搜索,因此推荐使用主键查询以提高效率。在插入新值时,B+树需要维护有序性,可能导致数据页分裂影响性能。自增主键在插入时可避免数据挪动和页分裂,且占用存储空间小,通常更为理想。然而,如果场景仅需唯一索引,可直接设为主键以减少查询步骤。

二叉树的搜索效率最高,但是大多数的数据库存储不适用二叉树,因为索引不止在内存里,还在磁盘上。一棵100万节点的平衡二叉树,树高20,依次查询可能访问20个数据块,从磁盘随机读一个数据块需要10ms左右的寻址时间,那么单独访问一行需要200ms时间,效率很低。为了让一个查询尽可能少得读磁盘,就必须让查询过程访问尽量少的数据块,所以应该使用N叉树,N取决于数据块的大小。

InnoDB的索引模型

InnoDB里使用了B+树索引模型,所有的数据都是存储在B+树里的,每一个索引在InnoDB里对应一棵B+树。

假设有一个主键列为ID的表,表中有字段k,并且k上有索引。表中R1~R5的(ID,k)值分别为(100,1)、(200,2)、(300,3)、(500,5)和(600,6),两棵树的示例示意图如下

image-20240413121708450.png

根据叶子节点的内容,索引类型分为主键索引和非主键索引。主键索引的叶子节点存的是整行数据,在InnoDB里,主键索引也被成为聚簇索引。非主键索引的叶子节点内容是主键的值,在InnoDB里,非主键索引也被成为二级索引。

根据上面的接口,思考一个问题:基于主键索引和普通索引的查询有什么区别?

  • 主键查询方式,只需要搜索ID这棵B+树
  • 普通索引查询方式,需要先搜索k索引树,得到ID的值后,再到ID索引树搜索一次,这个过程称为回表。

基于非主键索引的查询需要多扫描一棵索引树,因此应该尽量使用主键查询

索引维护

B+树为了维护索引有序性,在插入新值的时候需要做必要的维护。如果插入新的行ID值为700,则只需要在R5的记录后面插入一个新记录。如果新插入得ID值为400,就需要逻辑上挪动后面的数据,空出位置。

更糟的情况是,如果R5所在的数据页已经满了,根据B+树的算法,需要申请一个新的数据页,然后挪动部分数据过程,这个过程称为页分裂。在这种情况下,性能会受影响。而且页分裂操作还会影响数据页的利用率,原本放在一个页的数据,现在放到两个页中,整体空间利用率降低大约50%。

有分裂就有合并,当相邻两个页由于删除了数据,利用率很低后,会做数据页合并。

基于上面索引维护的过程,来讨论一个案例。

哪些场景建表额时候应该使用自增主键,哪些场景不应该

1. 性能角度:

自增主键的插入模式中,插入新记录的时候可以不指定ID的值,系统会获得当前ID最大值+1作为下一条记录的ID值。这个模式正符合了之前提到的递增插入的场景,每插入一条新记录都是追加操作,都不涉及挪动其他记录,也不会触发叶子节点的分裂

用有业务逻辑的字段做主键,往往不容易保证有序插入,写数据成本较高。

2.存储空间角度:

假设表里确实有一个唯一字段,比如字符串类型的身份证号,应该用身份证号做主键还是自增字段做主键呢?

由于每个非主键索引的叶子节点上都是主键的值,如果用身份证号做主键,每个二级索引的叶子节点占用约20个字节。如果用整型做主键,只需要4个字节。显然主键的长度越小,普通索引的叶子节点就越小,普通索引占用的空间也越小。

综合性能和存储空间角度,自增主键往往是更合理的选择。

如果有些业务的场景需求如下:

  1. 只有一个索引
  2. 该索引必须为唯一索引

也就是典型的KV场景,由于没有其他索引,所以也不用考虑其他索引的叶子节点大小的问题,这个时候就要优先考虑“尽量使用主键查询”原则,直接将这个索引设置为主键,避免查询的时候需要搜索两棵树。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
6天前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
|
29天前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
20天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
92 1
|
25天前
|
NoSQL 关系型数据库 MySQL
MySQL与Redis协同作战:优化百万数据查询的实战经验
【10月更文挑战第13天】 在处理大规模数据集时,传统的关系型数据库如MySQL可能会遇到性能瓶颈。为了提升数据处理的效率,我们可以结合使用MySQL和Redis,利用两者的优势来优化数据查询。本文将分享一次实战经验,探讨如何通过MySQL与Redis的协同工作来优化百万级数据统计。
55 5
|
30天前
|
存储 关系型数据库 MySQL
如何在MySQL中进行索引的创建和管理?
【10月更文挑战第16天】如何在MySQL中进行索引的创建和管理?
62 1
|
20天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
49 0
|
1月前
|
监控 关系型数据库 MySQL
mysql8索引优化
综上所述,深入理解和有效实施这些索引优化策略,是解锁MySQL 8.0数据库高性能查询的关键。
36 0
|
11天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
26 1
|
13天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
29 4
|
1月前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
63 3
Mysql(4)—数据库索引
下一篇
无影云桌面