MySQL 索引数据结构

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: mysql 中有一种机制是表锁定和行锁定,是为了保证数据的完整性。表锁定表示你们都不能对这张表进行操作,必须等我对表操作完才行。行锁定也一样,别的 sql 必须等我对这条数据操作完了,才能对这条数据进行操作。

为什么是 B + 树

如果是用 AVL 平衡二叉树,树高度太高,索引查询需要访问磁盘;
每次访问以节点为单位进行磁盘 I/O ,需要尽量减少数据读取的 I/O 操作;
所以树高度一定不能太高,存储千万级别的数据,实践中 B+ 树的高度也就 4 或者 5。

B + 树经常用来比较的是 B 树;
B + 树的特点是所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;
对于范围查找,比如 15~50,B 树需要中序遍历二叉树,但是 B + 树直接在叶子节点顺序访问就可以了。

最左匹配原则

最左前缀匹配原则:在 MySQL 建立联合索引时会遵守最左前缀匹配原则;
即最左优先,在检索数据时从联合索引的最左边开始匹配。

索引的底层是一颗 B + 树,那么联合索引的底层也就是一颗 B + 树;
只不过联合索引的 B + 树节点中存储的是逗号分隔的多个值。

举例:创建一个 index_magor_class (magor,class) 的联合索引;
它是先根据 magor 排序,再根据 class 排序,如果索引后面还有字段,继续以此类推。

我们查询的 where 条件如果只传入了班级,是走不到联合索引的;
但是如果只传了学院编号,是可能会走到联合索引的。
MYSQL 的执行计划和查询的实际执行过程并不完全吻合;
比如你数据库数据量很少,可能直接全量遍历速度更快,就不走索引了。

在建表的时候如何设计索引

1、利用覆盖索引来进行查询操作,来避免回表操作。

比如我们表主键索引是学号,另外我们还根据手机号也建了索引,如果我们 where 条件是手机号
如果我们 select 获取的字段是学号,直接在手机号的索引表就能获取到数据,不需要回表;
如果我们 select 的时候还有其他字段,我们查询的时候流程是这样的,先根据手机号查到学号;
再根据学号去主键索引表查询数据,这个过程叫回表。

2、业务上具有唯一特性的字段,即使是组合字段,也建议建成唯一索引。
即使在应用层做了非常完善的校验和控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生。

3、超过三个表禁止 join。
需要 join 的字段,数据类型保持绝对一致;多表关联查询时,保证被关联的字段需要有索引。

4、在 varchar 字段上建立索引时,必须指定索引长度,没必要对全字段建立索引。
索引的长度与区分度是一对矛盾体,一般对字符串类型数据,长度为 20 的索引,区分度会高达 90% 以上
可以使用 count (distinct left (列名,索引长度))/count (*) 的区分度来确定。

5、页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决。

6、索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。

7、建组合索引的时候,区分度最高的在最左边。

8、防止因字段类型不同造成的隐式转换,导致索引失效。

MyBatis一二级缓存

Mybatis 的一级缓存是指 SQLSession,
一级缓存的作用域是 SQlSession, Mabits 默认开启一级缓存。
在同一个 SqlSession 中,执行相同的 SQL 查询时;
第一次会去查询数据库,并写在缓存中,第二次会直接从缓存中取。
当执行 SQL 时候两次查询中间发生了增删改的操作,则 SQLSession 的缓存会被清空。
每次查询会先去缓存中找,如果找不到,再去数据库查询,然后把结果写到缓存中。
Mybatis 的内部缓存使用一个 HashMap,key 为 hashcode+statementId+sql 语句。
Value 为查询出来的结果集映射成的 java 对象。
SqlSession 执行 insert、update、delete 等操作 commit 后会清空该 SQLSession 缓存。

二级缓存是 mapper 级别的,Mybatis 默认是没有开启二级缓存的。
第一次调用 mapper 下的 SQL 去查询用户的信息,查询到的信息会存放在该 mapper 对应的二级缓存区域。
第二次调用 namespace 下的 mapper 映射文件中,相同的 sql 去查询用户信息,会去对应的二级缓存内取结果。

MySQL 主从同步

Master 数据库只要发生变化,立马记录到 Binary log 日志文件中
Slave 数据库启动一个 I/O thread 连接 Master 数据库,请求 Master 变化的二进制日志
Slave I/O 获取到的二进制日志,保存到自己的 Relay log 日志文件中。
Slave 有一个 SQL thread 定时检查 Realy log 是否变化,变化那么就更新数据

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
15天前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
1月前
|
存储 NoSQL 关系型数据库
为什么MySQL不使用红黑树做索引
本文详细探讨了MySQL索引机制,解释了为何添加索引能提升查询效率。索引如同数据库的“目录”,在数据量庞大时提高查询速度。文中介绍了常见索引数据结构:哈希表、有序数组和搜索树(包括二叉树、平衡二叉树、红黑树、B-树和B+树)。重点分析了B+树在MyISAM和InnoDB引擎中的应用,并讨论了聚簇索引、非聚簇索引、联合索引及最左前缀原则。最后,还介绍了LSM-Tree在高频写入场景下的优势。通过对比多种数据结构,帮助理解不同场景下的索引选择。
65 6
|
29天前
|
SQL 关系型数据库 MySQL
案例剖析:MySQL唯一索引并发插入导致死锁!
案例剖析:MySQL唯一索引并发插入导致死锁!
案例剖析:MySQL唯一索引并发插入导致死锁!
|
23天前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
56 3
Mysql(4)—数据库索引
|
17天前
|
存储 关系型数据库 MySQL
如何在MySQL中进行索引的创建和管理?
【10月更文挑战第16天】如何在MySQL中进行索引的创建和管理?
41 1
|
6天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
38 0
|
7天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
34 0
|
1月前
|
监控 关系型数据库 MySQL
MySQL数据表索引命名规范
MySQL数据表索引命名规范
39 1
|
1月前
|
存储 SQL 关系型数据库
mysql中主键索引和联合索引的原理与区别
本文详细介绍了MySQL中的主键索引和联合索引原理及其区别。主键索引按主键值排序,叶节点仅存储数据区,而索引页则存储索引和指向数据域的指针。联合索引由多个字段组成,遵循最左前缀原则,可提高查询效率。文章还探讨了索引扫描原理、索引失效情况及设计原则,并对比了InnoDB与MyISAM存储引擎中聚簇索引和非聚簇索引的特点。对于优化MySQL性能具有参考价值。
|
1月前
|
存储 关系型数据库 MySQL
MySQL中的索引及怎么使用
综上所述,MySQL索引的正确使用是数据库性能调优的关键一环。通过合理设计索引结构,结合业务需求和数据特性,可以有效提升数据库查询响应速度,降低系统资源消耗,从而确保应用的高效运行。
60 1