高性能 MySQL(七):11个高性能的索引策略

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 正确地创建和使用索引,是实现高性能查询的基础。高效地选择和使用索引有很多种方式,其中有些是针对特殊案例的优化方法,有些则是针对特定行为的优化。

image.png

大家好,我是水滴~~

正确地创建和使用索引,是实现高性能查询的基础。高效地选择和使用索引有很多种方式,其中有些是针对特殊案例的优化方法,有些则是针对特定行为的优化。

接下来介绍一些索引策略,希望能帮助你理解如何高效地使用索引。

🌲 1. 独立的列

“独立的列”是指索引列不能是表达式的一部分,也不能是函数的参数。

例如,下面查询中,索引列age是表达式的一部分,则无法使用该列索引:

select * from `user` where age + 1 = 19;

凭肉眼很容易看出,条件表达式其实等价于 age = 18,但 MySQL 无法自动解析这个过程。所以,我们应该养成简化where条件的习惯。

另外,下面查询中,索引列create_time是函数的参数,则无法使用该列索引:

select * from `user` where LEFT(`name`, 1) = '张'

🌲 2. 前缀索引

有时候需要索引列的字符很长,这会让索引变得大且慢。通常可以使用前缀来索引开始的部分字符,这样可以大大节约索引空间,从而提高索引效率。

对于 BLOB、TEXT 或很长的 VARCHAR 类型的列,必须使用前缀索引,因为 MySQL 不允许索引这些列的完整长度。

🌲 3. 多列索引

很多人对多列索引(联合索引)的理解不够,认为“将where条件后面的列都建上索引”就可以了。其实不然,这样虽然能起到一定的作用,但决不是最优的。

例如,下面这条语句,为agesex建立了单列索引。那么该语句在执行时,会先通过age列索引找出40岁的用户,然后再从这个结果集中找到sex为女的用户。

select * from `user` where age = 40 and sex = '女';

如果使用多列索引,会通过该索引一次性找到正确的结果。

🌲 4. 索引顺序

正确的索引顺序依赖于使用该索引的查询,并且同时需要考虑如何更好地满足排序和分组的需要。在一个多列 B-Tree 索引中,索引列的顺序意味着索引首先按照最左列进行排序,其次是第二列,这样依次类推。所以多列索引的列顺序至关重要。

那么如何选择索引的列顺序呢?有一个经验法则:将选择性最高的列放到索引最前列。

例如,在下面查询中,我们是创建一个(age, sex)索引还是应该颠倒一下顺序呢?

select * from `user` where age = 40 and sex = '女';

我们可以通过一些查询来看表中值的分页情况,并确定哪个列的选择性更高:

4ca69b0bcb96dc5179fc780bfa580cd6_image_auth_key=1686637048-ptPwZNqArN2Gi4p2XLRRsm-0-ef115742cc31faecf490f340a77e0607&file_size=8918.png

通过查询结果可以看出,age列的数量更小,所以选择性更高,应该将索引列age放到前面。

🌲 5. 聚簇索引

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式。通过聚簇索引访问行很快,因为索引直接指向包含行数据的页面。

当表中有聚簇索引时,它的数据行实际上存放在索引的叶子页中,无法同时把数据行存放在两个不同的地方,所以一个表中只能有一个聚簇索引。

InnoDB 通过主键聚集数据,如果没有定义主键,会使用第一个唯一索引(并且是非空的)作为聚簇索引。如果两者都没有,InnoDB 会生成一个隐藏的聚簇索引。

对于主键 MySQL 推荐使用 AUTO_INCREMENT 自增序列,这样可以保证数据行是顺序写入的,通过主键进行查询时性能会更好。

最好避免使用随机的或不连续的值做为主键,比如 UUID,它让聚簇索引的插入变得完全随机,使得数据没有任何聚集特性。

🌲 6. 覆盖索引

如果一个索引包含所有需要查询的字段值,我们就称之为“覆盖索引”。

覆盖索引能够极大地提高性能,因为索引中就包含我们想要的数据,这样就能直接找到结果数据,不用再加表查询。

例如,有一个索引是(age, name),如果执行下面查询时,可以通过索引直接获取name数据,而无需回表查询。

select name from `user` where age = 40;

🌲 7. 通过索引来排序

扫描索引本身是很快,因为索引是顺序存储,只需从一条索引记录移动到下一条记录。但如果索引不能覆盖查询所需的全部列,那就不得不每扫描一条索引记录就都加表查询一次对应的行。这基本上都是随机 I/O,因此按索引顺序读取数据的速度,通常比顺序地全表扫描慢。

只有当索引的列顺序和order by子句的顺序完全一致,并且所有列的排序方法都一样时,MySQL 才能够使用索引来对结果做排序。如果查询需要关联多张表,则只有当order by子句引用的字段全部为第一个表时,才能使用索引做排序。

🌲 8. 压缩(前缀压缩)索引

MyISAM 使用前缀压缩来减少索引的大小,从而让更多的索引可以放入内存中,这在某些情况下能极大地提高性能。

压缩块使用更少的空间,代价是某些操作可能更慢。因为每个值的压缩前缀都依赖前面的值。所以 MyISAM 查找时无法在索引块使用二分查找,而只能从头开始扫描。

🌲 9. 重复和冗余索引

重复索引是指在相同的列上,按照相同的顺序创建相同类型的索引。

MySQL 允许在相同列上创建多个索引,并且会单独维护这些索引,优化器在优化查询的时候也会逐个进行考虑,这会影响性能。应该避免创建重复索引,发现以后也应该立即移除。

有时会在不经意间创建了重复索引,例如下面代码:

create table test(
  id INT NOT NULL PRIMARY KEY,
  a INT NOT NULL,
  b INT NOT NULL,
  UNIQUE(id),
  INDEX(id)
) ENGINE=InnoDB;

该代码先将id列标记为主键,再标记为唯一索引,又加上了索引。事实上,MySQL 的唯一索引和主键都是通过索引实现的,因此,上面的写法实际上就是创建了三个重复的索引。

冗余索引和重复索引有一些不同。如果创建了索引(A, B),再创建索引(A)就是冗余索引,因为(A)只是(A, B)的前缀索引。因此索引(A, B)也可以当作索引(A)来使用。但是如果再创建索引(B, A)(B),则不是冗余索引。

🌲 10. 未使用的索引

除了冗余索引和重复索引,可能还会有一些永远不用的索引,这样的索引完全是累赘,建议删除。

删除前也需斟酌,比如唯一索引,虽然该索引一直没有被查询使用,却可能是用于避免产生重复数据的。

🌲 11. 索引和锁

索引可以让查询锁定更少的行。

InnoDB 只有在访问行的时候才会对其加锁,而索引能够减少 InnoDB 访问的行数,从而减少锁的数量。

如果索引无法过滤掉无效的行,那么在 InnoDB 检索到数据并返回给服务器层以后,MySQL 服务器才能应用where子句。这时已经无法避免锁定行了,虽然已经锁定了这些行,但会在服务器端过滤掉行后就释放锁。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
177 9
|
17天前
|
SQL 存储 关系型数据库
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
80 22
 MySQL秘籍之索引与查询优化实战指南
|
18天前
|
存储 关系型数据库 MySQL
MySQL中为什么要使用索引合并(Index Merge)?
通过这些内容的详细介绍和实际案例分析,希望能帮助您深入理解索引合并及其在MySQL中的
68 10
|
1月前
|
存储 Oracle 关系型数据库
索引在手,查询无忧:MySQL索引简介
MySQL 是一款广泛使用的关系型数据库管理系统,在2024年5月的DB-Engines排名中得分1084,仅次于Oracle。本文介绍MySQL索引的工作原理和类型,包括B+Tree、Hash、Full-text索引,以及主键、唯一、普通索引等,帮助开发者优化查询性能。索引类似于图书馆的分类系统,能快速定位数据行,极大提高检索效率。
59 8
|
1月前
|
缓存 关系型数据库 MySQL
MySQL 索引优化以及慢查询优化
通过本文的介绍,希望您能够深入理解MySQL索引优化和慢查询优化的方法,并在实际应用中灵活运用这些技术,提升数据库的整体性能。
75 7
|
1月前
|
缓存 关系型数据库 MySQL
MySQL 索引优化与慢查询优化:原理与实践
通过本文的介绍,希望您能够深入理解MySQL索引优化与慢查询优化的原理和实践方法,并在实际项目中灵活运用这些技术,提升数据库的整体性能。
102 5
|
25天前
|
存储 关系型数据库 MySQL
【MYSQL】 ——索引(B树B+树)、设计栈
索引的特点,使用场景,操作,底层结构,B树B+树,MYSQL设计栈
|
1天前
|
缓存 关系型数据库 MySQL
【深入了解MySQL】优化查询性能与数据库设计的深度总结
本文详细介绍了MySQL查询优化和数据库设计技巧,涵盖基础优化、高级技巧及性能监控。
11 0
|
28天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
57 3
|
28天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
68 3