MySQL数据库 InnoDB引擎索引原理与设计索引调优简述

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云数据库 RDS MySQL Serverless,价值2615元额度,1个月
简介:   MySQL的InnoDB引擎比较常用,了解它的索引原理,才能在设计索引的时候得心应手,轻松应对数据库表的优化。  也叫聚簇索引。  聚集索引 !=主键索引;  任何表都必然会有聚集索引,而主键索引并非必然存在。

  MySQL的InnoDB引擎比较常用,了解它的索引原理,才能在设计索引的时候得心应手,轻松应对数据库表的优化。

  也叫聚簇索引。

  聚集索引 !=主键索引;

  任何表都必然会有聚集索引,而主键索引并非必然存在。

  存在主键时,聚集索引选择主键索引来建立 没有主键时,聚集索引选择在后面的第一个唯一索引的列建立 没有唯一索引时,创建隐含列row_id来建立聚集索引,row_id是6位的整型,不能被引用

  实践中,通常都会指定主键,所以它们通常是同一回事。

  所有索引都是 B+Tree 方式存储,高度维持在3~4层, 只有叶子节点存储数据(这里已然是存了每行的所有列的数据);

  聚集索引的叶子节点数据, 逻辑上按照索引列正序排序,物理上不连续 ;

  每个节点的大小等于内存中的一页的大小(页是计算机管理存储器的逻辑块,许多OS中,页的大小通常为4K),使得每次获取一个节点时只需要一次IO;

  一个节点内的数据不一定填满整个节点,如果需要插入数据时,可快速插入而不必分拆节点。

  叶子节点的数据即是表数据的实际存储位置 ,当不使用任何索引查询时,直接按原正序遍历数据。

  也叫二级索引。

  所有索引都是 B+Tree 方式存储,高度维持在3~4层,只有二手叶子节点存储数据,但 叶子节点只存了聚集索引的列(如果聚集索引是主键,那么就是存了主键id的值,否则就是隐含列row_id;后面为省事直接叫id,实际意义以此描述为准);

  可以将辅助索引理解为一个小表,数据列含有索引列及id。

  索引覆盖:

  查询的 列范围是本次查询使用的索引包含的列及id 时,即为索引覆盖,表示本次查询的列的数据可以直接从索引中获取,不需要回表查询;

  查询语句前加上 explain 分析时,extra 列的值是 using index 时就表示本次查询属于索引覆盖。

  回表:

  相反,查询的列范围超出本次查询使用的索引包含的列及id时, 其他列的数据无法在索引中确定,必须要回表获取 ——这种行为就是回表;

  查询语句前加上 explain 分析时,extra 列的值是 using index condition,表示本次查询使用了索引的结果作为条件再回表获取数据。

  回表时, 通过辅助索引存储的id,去聚集索引直接定位获取对应的数据 ,再取出对应的列。

  小结:

  如果能够 避免回表,有助于提升查询的速度 。

  对于使用 Redundant 或者 Compact 格式的 InnoDB 表,索引键前缀长度限制为767字节。如果 TEXT 或 VARCHAR 列的前缀索引超过191个字符,则可能会达到此限制(假定为 utf8mb4 字符集,每个字符最多4个字节)。

  设计表时, 尽量给出合理的长度 ,避免字段太长导致索引长度过长,进而影响索引的性能。

  因为索引虽然加快查询速度,但是过多的索引也会成为数据库的负担,毕竟索引也需要磁盘存储起来的。

  与之相对的是单列索引,即是只在一个列上加索引的情况;

  单列索引无法满足需求时,可通过多个字段创建复合索引,也叫组合索引,也有些人习惯性的叫联合索引等,叫法不重要,反正就那意思。

  复合索引遵循 最左匹配原则 ,就是说查询时,右边或中间的字段可以少,左边的不可以少,否则索引失效。

  设计复合索引时需要注意:

  选择性好的字段在前(即使用频繁的字段),反之在后 用于范围查询的字段在后,即使用 between、in、>、<、>=等的情况

  因为复合索引遵循最左匹配原则,否则索引失效,但在 MySQL8.0 之后对某些特殊情况做了优化,即:如果左边的列缺失,但是 左边列的唯一值少而右面列的唯一值多 时,数据库直接跳过左边的列进行索引扫描,而不是直接遍历表。

  跳跃索引是优化的结果,并不是必然存在(不符合条件就不存在),也不是存在过以后就一直存在(刚开始符合条件但后面数据的变化导致不符合条件,以后也不会存在),所以最好还是不要依赖数据库的优化,同时要认清MySQL数据库的版本。

  本文讲述了聚集索引与辅助索引的概念及其数据结构,基于 B+Tree 数据结构进一步说明了索引覆盖与回表是如何发生的,以及各种索引设计时需要注意的地方。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2天前
|
存储 关系型数据库 MySQL
【MySQL系列笔记】InnoDB引擎-数据存储结构
InnoDB 存储引擎是MySQL的默认存储引擎,是事务安全的MySQL存储引擎。该存储引擎是第一个完整ACID事务的MySQL存储引擎,其特点是行锁设计、支持MVCC、支持外键、提供一致性非锁定读,同时被设计用来最有效地利用以及使用内存和 CPU。因此很有必要学习下InnoDB存储引擎,它的很多架构设计思路都可以应用到我们的应用系统设计中。
21 4
|
3天前
|
存储 算法 搜索推荐
矢量数据库基础:概念、原理与应用场景
【4月更文挑战第30天】矢量数据库,处理高维向量数据的工具,应用于GIS、推荐系统、图像搜索及语义搜索。核心原理是将原始数据嵌入到高维空间,通过索引算法优化搜索性能。现代深度学习模型如Word2Vec提升向量表示准确性,KD-Tree、LSH等算法加速相似性搜索。随着技术发展,矢量数据库在数据科学领域的重要性日益增强。
|
6天前
|
存储 监控 关系型数据库
【MySQL】InnoDB 什么情况下会产生死锁
【MySQL】InnoDB 什么情况下会产生死锁
|
8天前
|
SQL 关系型数据库 MySQL
|
2天前
|
SQL 关系型数据库 MySQL
【MySQL-3】图形化界面工具DataGrip安装&配置&使用
【MySQL-3】图形化界面工具DataGrip安装&配置&使用
|
2天前
|
关系型数据库 MySQL Linux
【MySQL-2】MySQL的下载&安装&启停&配置环境变量【一条龙教程】
【MySQL-2】MySQL的下载&安装&启停&配置环境变量【一条龙教程】
|
3天前
|
弹性计算 关系型数据库 MySQL
在线安装MySQL5.7和MySQL8.0
【4月更文挑战第30天】
14 0
|
3天前
|
存储 关系型数据库 MySQL
docker安装mysql8忽略大小写
docker安装mysql8忽略大小写
|
3天前
|
Ubuntu 关系型数据库 MySQL
Ubuntu 20.04 + mysql8 安装以及配置大小写不敏感
Ubuntu 20.04 + mysql8 安装以及配置大小写不敏感
|
3天前
|
关系型数据库 MySQL 开发工具
Docker安装mysql8.0
Docker安装mysql8.0