mysql索引原理以及sql优化

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: mysql索引原理以及sql优化

索引与约束

       索引是有序的存储结构,是按单个或多个列的值进行排序,主要是为了提升搜索效率;

索引分类

       按数据结构划分包括B+树索引,hash索引,全文索引elasticsearch;按物理存储划分包括聚集索引,辅助索引(要查找数据得先通过辅助索引查找到聚集索引,然后再通过聚集索引查找数据);按列的属性进行划分包括主键索引(非空唯一索引),唯一索引(允许出现一个null),普通索引,前缀索引(只比较前几个字符的长字符串);按列的个数划分包括单列索引,组合索引;

索引的代价

       占用空间,有维护的代价,主要体现在dml操作会变慢;

       innodb必须要有一个主键,因为innodb主键索引对应聚集索引B+树;B+树是多路平衡搜索树, 中序遍历是有序的;所有的叶子节点都在同一层,并且叶子节点构成了双向链表,节点的大小都为数据页的大小即16k,因为一个扇区是512字节,因为读磁盘时都是8个扇区为单位也就是4k;innodb中我们叶子节点中至少要存储两行数据;非叶子节点只会记录索引信息,叶子节点记录数据信息;按照主键构建的B+树,叶子节点中存放数据页,数据也是索引的一部分;

       辅助索引中,叶子节点不包含行记录的全部数据,辅助索引的叶子节点中,除了用来排序的key还包含一个bookmark;该书签存储了聚集索引的key;

       索引使用B+树实现是为了降低磁盘io和范围查询;mysql使用索引的场景如where判断,group by,order by;mysql使用不索引的场景如没有where判断,group by,order by,以及区分度不高的列,区分度是指列中数据差异不同的列有多少;经常修改的列不要创建索引;表的数据量少也不要创建索引;

覆盖索引

       覆盖索引是一种数据查询方式,针对的是辅助索引;直接通过辅助索引B+树就能获取查询的值,而无需通过回表查询;在select中尽量写我们需要的字段;

最左匹配原则

       最左匹配原则针对的是组合索引,匹配规则是从左到右依次进行匹配;遇到>或<或between like就停止匹配;

索引下推

       索引下推也主要是为了减少回表次数;如果没有索引下推,那么server层向存储引擎层请求数据,在server层根据索引条件进行数据过滤;有索引下推,则将索引条件判断下推到存储引擎中过滤数据,最终由存储引擎层进行数据汇总返回到server层;

索引存储

       数据是不是会缓存在磁盘中;

       innodb数据结构,分为在内存中的数据结构,和磁盘中的数据结构;buffer pool是用来缓存表和索引数据的,聚集索引在buffer pool修改;采用LRU算法让buffer pool只缓存比较热的数据;change buffer用来缓存二级索引,如果是辅助索引的修改会先在change buffer中修改,change buffer的数据会异步刷新到buffer pool中;

       buffer pool默认是128M数据,为了阻止buffer pool中的数据,我们用free list,flush list,lru list;链表中记录的都是buffer pool中的页信息;128M存储不了大量数据,这是就通过淘汰策略更新lru list最近最少使用的数据链表;

增删改数据

       如果数据在buffer pool中则直接修改,并将数据页放到flush list中,在未来进行刷盘,但是不会每次增删改都会落盘,而是通过另外线程对flush list统一落盘;

change buffer

       change buffer是缓存非唯一索引的数据变更DML操作,change buffer中的数据将会异步merge到磁盘当中;free list组织buffer pool中未使用的缓存页,flush list组织buffer pool中脏页,也就是刷盘的页,lru组织buffer pool中冷热数据,当buffer pool没有空闲页,将lru list中最久未使用的数据进行淘汰;

索引存储

       数据页是16k,buffer pool用于缓存数据页,用于降低磁盘io次数;change buffer用于缓存非唯一索引的DML数据;

索引失效

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
21天前
|
SQL 存储 关系型数据库
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
88 22
 MySQL秘籍之索引与查询优化实战指南
|
1天前
|
存储 关系型数据库 MySQL
MySQL索引学习笔记
本文深入探讨了MySQL数据库中慢查询分析的关键概念和技术手段。
|
21天前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析
|
4天前
|
存储 关系型数据库 MySQL
浅入浅出——MySQL索引
本文介绍了数据库索引的概念和各种索引结构,如哈希表、B+树、InnoDB引擎的索引运作原理等。还分享了覆盖索引、联合索引、最左前缀原则等优化技巧,以及如何避免索引误用,提高数据库性能。
|
17天前
|
SQL 关系型数据库 MySQL
MySQL派生表合并优化的原理和实现
通过本文的详细介绍,希望能帮助您理解和实现MySQL中派生表合并优化,提高数据库查询性能。
58 16
|
18天前
|
SQL 关系型数据库 MySQL
MySQL派生表合并优化的原理和实现
通过本文的详细介绍,希望能帮助您理解和实现MySQL中派生表合并优化,提高数据库查询性能。
33 7
|
16天前
|
SQL 存储 关系型数据库
MySQL进阶突击系列(05)突击MVCC核心原理 | 左右护法ReadView视图和undoLog版本链强强联合
2024年小结:感谢阿里云开发者社区每月的分享交流活动,支持持续学习和进步。过去五个月投稿29篇,其中17篇获高分认可。本文详细介绍了MySQL InnoDB存储引擎的MVCC机制,包括数据版本链、readView视图及解决脏读、不可重复读、幻读问题的demo演示。
|
22天前
|
存储 关系型数据库 MySQL
MySQL中为什么要使用索引合并(Index Merge)?
通过这些内容的详细介绍和实际案例分析,希望能帮助您深入理解索引合并及其在MySQL中的
84 10
|
5天前
|
缓存 关系型数据库 MySQL
【深入了解MySQL】优化查询性能与数据库设计的深度总结
本文详细介绍了MySQL查询优化和数据库设计技巧,涵盖基础优化、高级技巧及性能监控。
63 0
|
29天前
|
存储 关系型数据库 MySQL
【MYSQL】 ——索引(B树B+树)、设计栈
索引的特点,使用场景,操作,底层结构,B树B+树,MYSQL设计栈