SQL提示与索引终章

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: SQL提示与索引终章

🚀SQL提示

tb_user表的数据情况如下 :


索引情况如下 :


把上述的  idx_user_age, idx_email 这两个之前测试使用过的索引直接删除

drop index idx_user_age on tb_user;
drop index idx_email on tb_user;

执行SQL: explain select * from tb_user where profession = '电气工程';

很明显查询走了联合索引

执行SQL,创建profession的单列索引:  createindexidx_user_proon tb_user(profession);

创建完单列索引之后,我们再执行语句explain select * from tb_user where profession = '电气工程';看看走哪个索引


测试结果,我们可以看到,possible_keys中  idx_user_pro_age_sta,idx_user_pro 这两个 索引都可能用到,最终MySQL选择了idx_user_pro_age_sta索引。这是MySQL自动选择的结果。

那么,我们能不能在查询的时候,自己来指定使用哪个索引呢?

当然可以指定使用特定的索引进行查询。在大多数数据库管理系统中,您可以在查询中明确指定要使用的索引。这通常通过在查询语句中添加关键字来实现,具体取决于您使用的数据库系统。例如,在许多 SQL 数据库中,您可以使用类似于 USE INDEX 或 FORCE INDEX 的语法来指定要使用的索引。

如果您正在使用 NoSQL 数据库或其他类型的数据存储,通常也会有类似的机制来允许您指定使用的索引。

请注意,虽然可以手动指定索引,但应该谨慎使用。数据库系统通常会自动选择最佳的索引,手动指定索引可能会导致性能问题,除非您对数据模式和查询性能有深入了解。

借助SQL提示完成手动指定索引

SQL提示,是优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些人为的提示来达到优 化操作的目的。

use index :建议MySQL使用哪一个索引完成此次查询(仅仅是建议,  mysql内部还会再次进行评估)。

explain select * from tb_user use index (idx_user_pro) where profession = '电气工程';

ignore index 忽略指定的索引。

explain select * from tb_user ignore index (idx_user_pro) where profession = '电气工程';

force index :    强制使用索引。

explain select * from tb_user force index (idx_user_pro) where profession = '电气工
程';


🚀覆盖索引

尽量使用覆盖索引,减少select *    那么什么是覆盖索引呢?覆盖索引是指  查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到  

覆盖索引是一种特殊类型的索引,它包含了在查询中涉及的所有字段,从而使得数据库系统无需访问实际的数据行就能够满足查询需求。这种索引覆盖了查询所需的所有列,因此称为"覆盖索引"。

当数据库执行查询时,如果能够仅通过索引就能够获取到需要的数据,那么数据库引擎就不必再去实际的数据表中查找相应的行,这样可以大大提高查询性能。覆盖索引通常用于查询中只需要返回索引列的情况,而不需要返回整个数据行的场景。

使用覆盖索引有以下几个优点:

减少IO操作:由于不需要访问实际的数据行,因此可以减少IO操作,提高查询性能。

减少内存消耗:覆盖索引可以减少数据库系统需要维护的内存空间,因为不需要缓存完整的数据行。

降低磁盘占用:由于不需要存储完整的数据行,覆盖索引可以节省磁盘空间。

要创建覆盖索引,您需要确保索引包含了查询中涉及的所有字段。在设计数据库时,考虑到查询的需求并合理地创建覆盖索引可以显著改善查询性能。

接下来,我们来看一组SQL的执行计划,看看执行计划的差别,然后再来具体做一个解析

explain select id, profession from tb_user where profession = '化工 ' and age =
38 and status =' 5 ' ;


explain select id,profession,age, status from tb_user where profession = '化工 '
and age = 38 and status = '5 ' ;


explain select id,profession,age, status, name from tb_user where profession = '化工 ' and age = 38 and status = '5 ' ;

explain select * from tb_user where profession = '化工 ' and age = 38 and status = '5 ';

从上述的执行计划我们可以看到,这四条SQL语句的执行计划前面所有的指标都是一样的,看不出来差异。但是此时,我们主要关注的是后面的Extra,前面两条SQL的结果为  Using where; Using  Index ; 而后面两条SQL的结果为 : null 或 Using index condition

Extra

Using where; Using Index

查找使用了索引但是需要的数据都在索引列中能找到以不需 要回表查询数据

Usingindex

condition

查找使用了索引但是需要回表查询数据

因为,在tb_user表中有一个联合索引  idx_user_pro_age_sta,该索引关联了三个字段  profession、age、status,而这个索引也是一个二级索引,所以叶子节点下面挂的是这一行的主键id。所以当我们查询返回的数据在id、profession、age、status 之中,则直接走二级索引直接返回数据了。如果超出这个范围,就需要拿到主键id,再去扫描聚集索引,再获取额外的数据了,这个过程就是回表。而我们如果一直使用select * 查询返回所有字段值,很容易就会造成回表查询(除非是根据主键查询,此时只会扫描聚集索引)。

为了更清楚的理解,什么是覆盖索引,什么是回表查询,看下面的这组SQL的执行过程。(以下内容和图片均来自黑马)

表结构及索引示意图 :


id是主键是一个聚集索引    name字段建立了普通索引是一个二级索引(辅助索引)

执行SQL: select * from tb_user where id = 2;


根据id查询直接走聚集索引查询一次索引扫描直接返回数据性能高

执行SQL  seletid,namefromtb_userwherename='Arm';


虽然是根据name字段查询,查询二级索引,但是由于查询返回在字段为id,name,在name的二级索引中,这两个值都是可以直接获取到的,因为覆盖索引,所以不需要回表查询,性能高。

执行SQL:  selet id,name,gender from tb_user where name = 'Arm';


由于在name的二级索引中,不包含gender,所以,需要两次索引扫描,也就是需要回表查询,性能相对较差一点

思考:

一张表 , 有四个字段 (id, username, password, status), 由于数据量大 , 需要对以下SQL语句进行优化 , 该如何进行才是最优方案 :

select id,username,password from tb_user where username = 'itcast';

答 : 针对于  username, password建立联合索引 , sql为 : create index idx_user_name_pass on tb_user(username,password);

这样可以避免上述的SQL语句,在查询的过程中,出现回表查询。

答:针对这个查询语句,最优的优化方案是创建一个覆盖索引,以便在查询时能够仅通过索引就获取所需的数据,而无需访问实际的数据行。在这种情况下,您可以创建一个包含 (username, id, password) 字段的索引。

以下是针对该表的创建覆盖索引的SQL语句:

CREATE INDEX idx_username_covering ON tb_user (username, id, password);

通过创建这样的覆盖索引,数据库系统在执行上述查询时,只需要访问索引而无需再去实际的数据行中查找相应的列,从而提高了查询性能。

🚀前缀索引

当字段类型为字符串( varchar  text,  longtext等)时,有时候需要索引很长的字符串,这会让 索引变得很大,查询时,浪费大量的磁盘IO影响查询效率此时可以只将字符串的一部分前缀立索引,这样可以大大节约索引空间,从而提高索引效率。

create index  idx_xxxx on table_name (column (n)) ;

示例

为tb_user表的email字段,建立长度为5的前缀索引

create index idx_email_5 on tb_user (email (5));



🚀前缀长度

可以根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高唯一索引的选择性是1这是最好的索引选择性性能也是最好的

缀索引的查询流程


🚀单列索引与联合索引

单列索引:即一个索引只包含单个列

联合索引:即一个索引包含了多个列

们先来看看  tb_user表中目前的索引情况:


在查询出来的索引中既有单列索引又有联合索引

我们来执行一条SQL语句看看其执行计划

explain select id,phone,name from tb_user where phone = '15377777775' and name = 'f';


通过上述执行计划我们可以看出来,在and连接的两个字段  phone、  name上都是有单列索引的,但是 最终mysql只会选择一个索引,也就是说,只能走一个字段的索引,此时是会回表查询的。

紧接着,我们再来创建一个phone和name字段的联合索引来查询一下执行计划

create unique index idx_user_phone_name on tb_user (phone,name);


此时,查询时,就走了联合索引,而在联合索引中包含 phone、  name的信息,在叶子节点下挂的是对应的主键id,所以查询是无需回表查询的。

在业务场景中,如果存在多个查询条件,考虑针对于查询字段建立索引时,建议建立联合索引,

而非单列索引。

如果查询使用的是联合索引,具体的结构示意图如下:


🚀索引设计原则

针对于数据量较大,且查询比较频繁的表建立索引。

针对于常作为查询条件(where)、排序( order by)、分组(group by)操作的字段建立索 引。尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。

如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。

尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间, 避免回表,提高查询效率。

要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增 删改的效率。

如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含 NULL值时,它可以更好地确定哪个索引最有效地用于查询。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
16天前
|
SQL 存储 关系型数据库
如何巧用索引优化SQL语句性能?
本文从索引角度探讨了如何优化MySQL中的SQL语句性能。首先介绍了如何通过查看执行时间和执行计划定位慢SQL,并详细解析了EXPLAIN命令的各个字段含义。接着讲解了索引优化的关键点,包括聚簇索引、索引覆盖、联合索引及最左前缀原则等。最后,通过具体示例展示了索引如何提升查询速度,并提供了三层B+树的存储容量计算方法。通过这些技巧,可以帮助开发者有效提升数据库查询效率。
34 2
|
5天前
|
SQL Oracle 关系型数据库
SQL优化-使用联合索引和函数索引
在一次例行巡检中,发现一条使用 `to_char` 函数将日期转换为字符串的 SQL 语句 CPU 利用率很高。为了优化该语句,首先分析了 where 条件中各列的选择性,并创建了不同类型的索引,包括普通索引、函数索引和虚拟列索引。通过对比不同索引的执行计划,最终确定了使用复合索引(包含函数表达式)能够显著降低查询成本,提高执行效率。
|
10天前
|
SQL 关系型数据库 MySQL
如何确认SQL用了索引:详细技巧与方法
在数据库管理中,索引是提高SQL查询性能的重要手段
|
1月前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
396 15
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
|
1月前
|
存储 关系型数据库 MySQL
MySQL高级篇——覆盖索引、前缀索引、索引下推、SQL优化、主键设计
覆盖索引、前缀索引、索引下推、SQL优化、EXISTS 和 IN 的区分、建议COUNT(*)或COUNT(1)、建议SELECT(字段)而不是SELECT(*)、LIMIT 1 对优化的影响、多使用COMMIT、主键设计、自增主键的缺点、淘宝订单号的主键设计、MySQL 8.0改造UUID为有序
MySQL高级篇——覆盖索引、前缀索引、索引下推、SQL优化、主键设计
|
9天前
|
SQL 存储 关系型数据库
SQL默认索引是什么:深入解析与技巧
在SQL数据库中,索引是一种用于提高查询性能的重要数据结构
|
10天前
|
SQL 存储 关系型数据库
SQL默认索引是什么
在SQL数据库中,索引是一种用于提高查询性能的数据结构
|
10天前
|
SQL 关系型数据库 MySQL
如何确认SQL用了索引
在数据库管理和优化过程中,确认SQL查询是否使用了索引是一个至关重要的步骤
|
1月前
|
SQL 存储 索引
SQL Server的Descending Indexes降序索引
【9月更文挑战第21天】在SQL Server中,降序索引允许指定列的排序顺序为降序,可显著优化涉及降序排序的查询性能,特别是在复合索引中。通过创建降序索引,可以更高效地满足特定业务需求,如按交易时间降序获取最新记录。然而,使用时需考虑查询频率、数据分布及维护成本,以确保最佳性能。
|
14天前
|
SQL 关系型数据库 MySQL
如何确认SQL查询是否使用了索引:详细步骤与技巧
在数据库管理和优化中,确认SQL查询是否有效利用了索引是提升性能的关键步骤