mysql中主键索引和联合索引的原理与区别

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 本文详细介绍了MySQL中的主键索引和联合索引原理及其区别。主键索引按主键值排序,叶节点仅存储数据区,而索引页则存储索引和指向数据域的指针。联合索引由多个字段组成,遵循最左前缀原则,可提高查询效率。文章还探讨了索引扫描原理、索引失效情况及设计原则,并对比了InnoDB与MyISAM存储引擎中聚簇索引和非聚簇索引的特点。对于优化MySQL性能具有参考价值。

索引是帮助MySQL高效获取数据的数据结构,本文主要介绍了mysql中主键索引和联合索引的原理与区别,具有一定的参考价值,感兴趣的可以了解一下

一、主键索引
主键索引:按照主键数据从小到大按照从左到右进行排序,叶节点只存储数据区;
接着将上面的页生成出来,页只存储索引和指针,指针指向数据域,当通过主键查找数据时,从B+树的头部开始寻址数据、读取数据。

上面为索引页
下面为数据页

查询select * from table where a=6,会从上到下走法,找索引

查询select * from table where a<6,会从上到下走法,找索引;
原因:先找a=6是走索引的,找到a=6数据后,将左边的数据全部返回即可。

为了方便把前面数据给你采用双向指针

查询select * from table where b=6,会从左到右走法,全表扫描,因为b未有命中索引。

二、什么是联合索引? 对应的B+树是如何生成的?
联合索引:将数据库表中多个字段组成一个索引。bcd联合索引;bcd三个字段进行排序

1、建立索引方式
create index idx_t1_bcd on t1(b,c,d);bcd三个字段进行排序

2、什么是最左前缀原则?
复合索引,也叫联合索引,用户可以在多个列上建立索引,这种索引叫做复合索引。
当我们创建一个组合索引的时候,如(k1,k2,k3),相当于创建了(k1)、
(k1,k2)和(k1,k2,k3)三个索引,这就是最左匹配原则。

1

select * from table where k1=A and k2=B and k3=C

3、回表

select from t1 where b=1 and c=1 and d=1执行逻辑:
通过联合索引找到一条数据的3个字段,但是select
查找多个字段,所以需要存储主键字段,通过主键字段去主键索引里面找到完整的这条数据,并将这条数据返回。

通过主键再去主键索引里面找数据的过程叫做回表

4、为什么要遵守最左前缀原则才能利用到索引?
explain select * from t1 where c=1 and d=1 and b=1 ;
最左前缀原则和后面条件的顺序没有关系

不符合最左匹配原则:*11

符合最左匹配原则:1*1

b=1:走联合索引 (需要回表1次)

b>1:不走联合索引(因为需要回表很多次)

拿到主键会到主键索引里面拿数据(回表7次)

5、什么是覆盖索引?
查询的字段正好在联合索引字段里面,不需要回表

select b from t1 where b>1;(不需要回表了,直接从联合索引字段中将该字段取出来)

1

select a,b,c,d from t1 where b>1;

同样的也符合联合索引,也不需要回表,因为a字段(主键)在联合索引中。

1

select a,b,c,d,e from t1 where b>1;

不走联合索引,需要回表,因为e字段不在联合索引中,需要回表很多次

6、索引扫描底层原理
从bcd索引的叶子节点开始遍历
主键索引存储的是8条完整的数据
联合索引中存储的是8条不完整的数据,并且b字段在联合索引中,不会去回表到主键索引中。

从叶子节点开始扫描不需要符合最左匹配原则。

7、order by为什么会导致索引消失?
因为走全表扫描效率更高,不需要回表
走索引会回表多次,效率低

8、有哪些情况会导致索引失效?
1、索引列使用!=、not、is null、is not null查询的时候,由于索引数据的检索效率非常低,因此Mysql引擎会判断不走索引。

2、使用like通配符匹配后缀%xxx的时候,由于这种方式不符合索引的最左匹配原则,所以也不会走索引。

但是反过来,如果通配符匹配的是前缀xxx%,符合最左匹配,也会走索引。
3、对索引列上进行函数运算、导致mysql无法识别索引列,就不会走索引了。

4、使用or连接查询的时候,or语句前后没有同时使用索引,那么索引会失效。只有or左右查询字段都是索引列的时候,才会生效。

5、当索引列存在隐式转化的时候, 比如索引列是字符串类型,但是在sql查询中没有使用引号。

9、索引设计原则
查询更快、占用空间更小

1、选择合适的列作为索引

1.经常作为查询条件(where子句)、排序条件(order by子句) 分组条件(group by子句)的列建立索引。
2、区分度低的字段,例如性别,不要建立索引
3、更新频繁字段不适合创建索引
4、对于定义为text、image和bit的数据类型的列不要建立索引
5、定义有外键的数据列一定要建立索引。
6、数据量较小的表,索引效果较差,没有必要在此列建立索引
7、尽量使用扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可。
8、使用短索引,如果对长字符串列进行索引,应该指定一个前缀长度,这样能够节省大量索引空间,如果搜索词
超过索引前缀长度,则使用索引排除不匹配的行,然后检查其余行是否可能匹配。
2、避免使用过多的索引

1、每个索引都需要占用额外的磁盘空间
2、更新表(update、insert、delete操作时),所有的索引都需要被更新
3、维护索引需要成本

三、InnoDB 与MyISAM 的区别

聚簇索引:将数据存储与索引放到了一块、并且是按照一定的顺序组织的,找到索引也就找到了数据,数据的物理存放顺序与索引顺序是一致的,即:只要索引是相邻的,那么对应的数据一定也是相邻地存放在磁盘上的。

非聚簇索引:叶子节点不存储数据、存储的是数据行地址,也就是说根据索引查找到数据行的位置再取磁盘查找数据,这个就有点类似一本树的目录,比如我们要找第三章第一节,那我们先在这个目录里面找,找到对应的页码后再去对应的页码看文章。

优势:
1、查询通过聚簇索引可以直接获取数据,相比非聚簇索引需要第二次查询(非覆盖索引的情况下)效率要高
2、聚簇索引对于范围查询的效率很高,因为其数据是按照大小排列的
3、聚簇索引适合用在排序的场合,非聚簇索引不适合

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
8月前
|
存储 SQL 关系型数据库
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
|
8月前
|
存储 关系型数据库 MySQL
MySQL数据库索引的数据结构?
MySQL中默认使用B+tree索引,它是一种多路平衡搜索树,具有树高较低、检索速度快的特点。所有数据存储在叶子节点,非叶子节点仅作索引,且叶子节点形成双向链表,便于区间查询。
233 4
|
6月前
|
存储 关系型数据库 MySQL
MySQL中的int(10)、char(10)与varchar(10)的类型和区别
在选择正确的数据类型时,需要仔细考虑每列的数据特点及应用程序的使用情况。合理的数据类型选择可以优化存储空间的使用,提高查询速度和数据库的整体性能。
684 14
|
7月前
|
存储 关系型数据库 MySQL
MySQL数据库中的 char 与 varchar的区别是什么
MySQL中的char和varchar均用于存储字符串,但有显著区别。char为定长类型,固定长度,存储空间始终为设定值,适合长度固定的数据如手机号。varchar为变长类型,仅占用实际数据所需空间,适合长度不固定的内容如用户名。二者在性能与空间利用上各有优劣,应根据实际场景合理选择。
512 0
|
8月前
|
存储 SQL 关系型数据库
MySQL 核心知识与索引优化全解析
本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分,阐述了 char 与 varchar 在存储方式和性能上的差异,以及事务的 ACID 特性、并发事务问题及对应的隔离级别(MySQL 默认 REPEATABLE READ)。 索引基础部分,详解了 InnoDB 默认的 B+tree 索引结构(多路平衡树、叶子节点存数据、双向链表支持区间查询),区分了聚簇索引(数据与索引共存,唯一)和二级索引(数据与索引分离,多个),解释了回表查询的概念及优化方法,并分析了 B+tree 作为索引结构的优势(树高低、效率稳、支持区间查询)。 索引优化部分,列出了索引创建的六大原则
203 2
|
6月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
480 158
|
6月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
6月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
1143 152
|
6月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎,提供高性价比、稳定安全的云数据库服务,适用于多种行业与业务场景。
878 156
|
6月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(中)
使用MYSQL Report分析数据库性能
483 156

相关产品

  • 云数据库 RDS MySQL 版
  • 推荐镜像

    更多