MySQL的索引原理与查询优化

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 一、MySQL 索引简介1、 MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。打个比方,如果合理的设计且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车。

一、MySQL 索引简介

1、 MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。

打个比方,如果合理的设计且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车。

2、索引分单列索引和组合索引。
  • 单列索引,即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引。
  • 组合索引,即一个索引包含多个列。
3、索引的详细分类:
  1. 普通索引index :加速查找
  2. 唯一索引
    • 主键索引:primary key :加速查找+约束(不为空且唯一)
    • 唯一索引:unique:加速查找+约束 (唯一)
  3. 联合索引
    • primary key(id,name):联合主键索引
    • unique(id,name):联合唯一索引
    • index(id,name):联合普通索引
  4. 全文索引fulltext :用于搜索很长一篇文章的时候,效果最好。
  5. 空间索引spatial :了解就好,几乎不用
4、创建索引时,你需要确保该索引是应用在 SQL 查询语句的条件(一般作为 WHERE 子句的条件)。

实际上,索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录。

5、索引的两大类型hash与btree
  1. 我们可以在创建上述索引的时候,为其指定索引类型,分两类
  • hash类型的索引:查询单条快,范围查询慢
  • btree类型的索引:b+树,层数越多,数据量指数级增长(我们就用它,因为innodb默认支持它)

2、不同的存储引擎支持的索引类型也不一样

  • InnoDB 支持事务,支持行级别锁定,支持 B-tree、Full-text 等索引,不支持 Hash 索引;
  • MyISAM 不支持事务,支持表级别锁定,支持 B-tree、Full-text 等索引,不支持 Hash 索引;
  • Memory 不支持事务,支持表级别锁定,支持 B-tree、Hash 等索引,不支持 Full-text 索引;
  • NDB 支持事务,支持行级别锁定,支持 Hash 索引,不支持 B-tree、Full-text 等索引;
  • Archive 不支持事务,支持表级别锁定,不支持 B-tree、Hash、Full-text 等索引;
6、滥用索引的缺点:
  • 第一,创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。

  • 第二,索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。

  • 第三,当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。

创建UNIQUE | FULLTEXT | SPATIAL 一样的方法

方法一:创建表时创建索引

CREATE TABLE mytable(  
    ID INT NOT NULL,   
    username VARCHAR(16) NOT NULL,  
   [UNIQUE | FULLTEXT | SPATIAL ]   INDEX | KEY  [indexName] (username(length))   
);  

方法二:CREATE在已存在的表上创建索引

CREATE [UNIQUE | FULLTEXT | SPATIAL | INDEX ]  indexName ON mytable(username(length)); 

方式三:修改表结构(添加索引)

ALTER table tableName ADD  [UNIQUE | FULLTEXT | SPATIAL | INDEX ] indexName(columnName)

删除索引的语法

DROP INDEX [indexName] ON mytable; 

三、实测索引的功效

1. 前期准备工作

  • 创建一个名为text的数据库:
create database text charset utf8;
  • 创建一张名为text的数据表
create table text(id int,name varchar(20))
  • 通过创建存储过程,实现批量插入记录(大约需要半小时时间)
delimiter $$ #声明存储过程的结束符号为$$
create procedure insertinfo()
BEGIN
    declare i int default 1;
    while(i<1000000)do
        insert into text values(i,concat('wangjifei',i));
        set i=i+1;
    end while;
END $$ 
delimiter ; #重新声明分号为结束符号为;
  • 查看存储过程
 show create procedure insertinfo\G 
  • 调用存储过程
 call insertinfo();

2、在没有索引的前提下测试查询速度

mysql> select * from text where id = 1234;
+------+---------------+
| id   | name          |
+------+---------------+
| 1234 | wangjifei1234 |
+------+---------------+
1 row in set (0.39 sec)
mysql> select * from text where name = 'wangjifei12345';
+-------+----------------+
| id    | name           |
+-------+----------------+
| 12345 | wangjifei12345 |
+-------+----------------+
1 row in set (0.53 sec)

3、加上索引

//1. 一定是为搜索条件的字段创建索引,比如select * from t1 where age > 5;就需要为age加上索引
//2. 在表中已经有大量数据的情况下,建索引会很慢,且占用硬盘空间,插入删除更新都很慢,只有查询快
//比如create index myname on text(name);会扫描表中所有的数据,然后以name为数据项,
//创建索引结构,存放于硬盘的表中。建完以后,再查询就会很快了

//给name加上普通索引
mysql> create index myname on text(name);
Query OK, 0 rows affected (18.31 sec)
Records: 0  Duplicates: 0  Warnings: 0

//给id加上唯一索引
mysql> create unique index myid on text(id);
Query OK, 0 rows affected (10.83 sec)
Records: 0  Duplicates: 0  Warnings: 0
效果立竿见影,查询速度翻了几十倍
mysql> select * from text where id = 1234;
+------+---------------+
| id   | name          |
+------+---------------+
| 1234 | wangjifei1234 |
+------+---------------+
1 row in set (0.00 sec)
mysql> select * from text where name = 'wangjifei12345';
+-------+----------------+
| id    | name           |
+-------+----------------+
| 12345 | wangjifei12345 |
+-------+----------------+
1 row in set (0.01 sec)
mysql> select * from text where name = 'wangjifei823458';
+--------+-----------------+
| id     | name            |
+--------+-----------------+
| 823458 | wangjifei823458 |
+--------+-----------------+
1 row in set (0.00 sec)

四、批量添加测试数据的方法:

  • 通过存储过程批量创建数据
1. 创建存储过程
delimiter $$ #声明存储过程的结束符号为$$
create procedure insertinfo()
BEGIN
   declare i int default 1;
   while(i<1000000)do
       insert into text values(i,concat('wangjifei',i));
       set i=i+1;
   end while;
END $$ 
delimiter ; #重新声明分号为结束符号为;

2. 查看存储过程
show create procedure insertinfo\G;

3. 调用存储过程
call insertinfo();

五、正确使用索引

  • 覆盖索引
    select * from text where name = 'wangjifei882345';
    该sql命中了索引,但未覆盖索引。利用name = 'wangjifei882345'到索引的数据结构中定位到该name在硬盘中的位置,或者说再数据表中的位置。

    但是我们select的字段为*,除了name以外还需要其他字段,这就意味着,我们通过索引结构取到name还不够,还需要利用该name再去找到该name所在行的其他字段值,这是需要时间的,

    很明显,如果我们只select name,就减去了这份苦恼,如下select name from text where name = 'wangjifei882345';这条就是覆盖索引了,命中索引,且从索引的数据结构直接就取到了name在硬盘的地址,速度很快

mysql> select name from text where name = 'wangjifei882345';
+-----------------+
| name            |
+-----------------+
| wangjifei882345 |
+-----------------+
1 row in set (0.00 sec)
  • 联合索引
    为了增加效果对比,在创建联合索引前将之前创建的普通索引删除掉了
mysql> select * from text where id = 2435353252 and name = 'wangjifei123333';
Empty set (0.58 sec)  //普通查询

mysql> create index idname on text(id,name); //创建联合索引
Query OK, 0 rows affected (26.86 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> select * from text where id = 2435353252 and name = 'wangjifei123333'; 
Empty set (0.00 sec)  // 联合索引查询
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4天前
|
存储 自然语言处理 关系型数据库
MySQL高级篇——索引的创建与设计原则
索引的分类与使用、MySQL8.0索引新特性、适合创建索引的情况、不适合创建索引的情况
MySQL高级篇——索引的创建与设计原则
|
4天前
|
存储 SQL 关系型数据库
MySQL高级篇——索引失效的11种情况
索引优化思路、要尽量满足全值匹配、最佳左前缀法则、主键插入顺序尽量自增、计算、函数导致索引失效、类型转换(手动或自动)导致索引失效、范围条件右边的列索引失效、不等于符号导致索引失效、is not null、not like无法使用索引、左模糊查询导致索引失效、“OR”前后存在非索引列,导致索引失效、不同字符集导致索引失败,建议utf8mb4
MySQL高级篇——索引失效的11种情况
|
4天前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
|
4天前
|
存储 缓存 关系型数据库
MySQL高级篇——存储引擎和索引
MyISAM:不支持外键和事务,表锁不适合高并发,只缓存索引,内存要求低,查询快MyISAM提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但MyISAM不支持事务、行级锁、外键,有一个毫无疑问的缺陷就是崩溃后无法安全恢复。5.5之前默认的存储引擎优势是访问的速度快,对事务完整性没有要求或者以SELECT、INSERT为主的应用针对数据统计有额外的常数存储。故而 count(*) 的查询效率很高表名.frm 存储表结构;表名.MYD 存储数据 (MYData);
MySQL高级篇——存储引擎和索引
|
4天前
|
存储 关系型数据库 MySQL
MySQL高级篇——覆盖索引、前缀索引、索引下推、SQL优化、主键设计
覆盖索引、前缀索引、索引下推、SQL优化、EXISTS 和 IN 的区分、建议COUNT(*)或COUNT(1)、建议SELECT(字段)而不是SELECT(*)、LIMIT 1 对优化的影响、多使用COMMIT、主键设计、自增主键的缺点、淘宝订单号的主键设计、MySQL 8.0改造UUID为有序
MySQL高级篇——覆盖索引、前缀索引、索引下推、SQL优化、主键设计
|
3天前
|
存储 SQL 关系型数据库
使用MySQL Workbench进行数据库备份
【9月更文挑战第13天】以下是使用MySQL Workbench进行数据库备份的步骤:启动软件后,通过“Database”菜单中的“管理连接”选项配置并选择要备份的数据库。随后,选择“数据导出”,确认导出的数据库及格式(推荐SQL格式),设置存储路径,点击“开始导出”。完成后,可在指定路径找到备份文件,建议定期备份并存储于安全位置。
45 11
|
27天前
|
SQL 关系型数据库 MySQL
【揭秘】MySQL binlog日志与GTID:如何让数据库备份恢复变得轻松简单?
【8月更文挑战第22天】MySQL的binlog日志记录数据变更,用于恢复、复制和点恢复;GTID为每笔事务分配唯一ID,简化复制和恢复流程。开启binlog和GTID后,可通过`mysqldump`进行逻辑备份,包含binlog位置信息,或用`xtrabackup`做物理备份。恢复时,使用`mysql`命令执行备份文件,或通过`innobackupex`恢复物理备份。GTID模式下的主从复制配置更简便。
112 2
|
22天前
|
弹性计算 关系型数据库 数据库
手把手带你从自建 MySQL 迁移到云数据库,一步就能脱胎换骨
阿里云瑶池数据库来开课啦!自建数据库迁移至云数据库 RDS原来只要一步操作就能搞定!点击阅读原文完成实验就可获得一本日历哦~
|
25天前
|
关系型数据库 MySQL 数据库
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
|
4天前
|
存储 SQL 关系型数据库
一篇文章搞懂MySQL的分库分表,从拆分场景、目标评估、拆分方案、不停机迁移、一致性补偿等方面详细阐述MySQL数据库的分库分表方案
MySQL如何进行分库分表、数据迁移?从相关概念、使用场景、拆分方式、分表字段选择、数据一致性校验等角度阐述MySQL数据库的分库分表方案。
一篇文章搞懂MySQL的分库分表,从拆分场景、目标评估、拆分方案、不停机迁移、一致性补偿等方面详细阐述MySQL数据库的分库分表方案

热门文章

最新文章