MySQL 索引数据结构

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS AI 助手,专业版
简介: mysql 中有一种机制是表锁定和行锁定,是为了保证数据的完整性。表锁定表示你们都不能对这张表进行操作,必须等我对表操作完才行。行锁定也一样,别的 sql 必须等我对这条数据操作完了,才能对这条数据进行操作。

为什么是 B + 树

如果是用 AVL 平衡二叉树,树高度太高,索引查询需要访问磁盘;
每次访问以节点为单位进行磁盘 I/O ,需要尽量减少数据读取的 I/O 操作;
所以树高度一定不能太高,存储千万级别的数据,实践中 B+ 树的高度也就 4 或者 5。

B + 树经常用来比较的是 B 树;
B + 树的特点是所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;
对于范围查找,比如 15~50,B 树需要中序遍历二叉树,但是 B + 树直接在叶子节点顺序访问就可以了。

最左匹配原则

最左前缀匹配原则:在 MySQL 建立联合索引时会遵守最左前缀匹配原则;
即最左优先,在检索数据时从联合索引的最左边开始匹配。

索引的底层是一颗 B + 树,那么联合索引的底层也就是一颗 B + 树;
只不过联合索引的 B + 树节点中存储的是逗号分隔的多个值。

举例:创建一个 index_magor_class (magor,class) 的联合索引;
它是先根据 magor 排序,再根据 class 排序,如果索引后面还有字段,继续以此类推。

我们查询的 where 条件如果只传入了班级,是走不到联合索引的;
但是如果只传了学院编号,是可能会走到联合索引的。
MYSQL 的执行计划和查询的实际执行过程并不完全吻合;
比如你数据库数据量很少,可能直接全量遍历速度更快,就不走索引了。

在建表的时候如何设计索引

1、利用覆盖索引来进行查询操作,来避免回表操作。

比如我们表主键索引是学号,另外我们还根据手机号也建了索引,如果我们 where 条件是手机号
如果我们 select 获取的字段是学号,直接在手机号的索引表就能获取到数据,不需要回表;
如果我们 select 的时候还有其他字段,我们查询的时候流程是这样的,先根据手机号查到学号;
再根据学号去主键索引表查询数据,这个过程叫回表。

2、业务上具有唯一特性的字段,即使是组合字段,也建议建成唯一索引。
即使在应用层做了非常完善的校验和控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生。

3、超过三个表禁止 join。
需要 join 的字段,数据类型保持绝对一致;多表关联查询时,保证被关联的字段需要有索引。

4、在 varchar 字段上建立索引时,必须指定索引长度,没必要对全字段建立索引。
索引的长度与区分度是一对矛盾体,一般对字符串类型数据,长度为 20 的索引,区分度会高达 90% 以上
可以使用 count (distinct left (列名,索引长度))/count (*) 的区分度来确定。

5、页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决。

6、索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。

7、建组合索引的时候,区分度最高的在最左边。

8、防止因字段类型不同造成的隐式转换,导致索引失效。

MyBatis一二级缓存

Mybatis 的一级缓存是指 SQLSession,
一级缓存的作用域是 SQlSession, Mabits 默认开启一级缓存。
在同一个 SqlSession 中,执行相同的 SQL 查询时;
第一次会去查询数据库,并写在缓存中,第二次会直接从缓存中取。
当执行 SQL 时候两次查询中间发生了增删改的操作,则 SQLSession 的缓存会被清空。
每次查询会先去缓存中找,如果找不到,再去数据库查询,然后把结果写到缓存中。
Mybatis 的内部缓存使用一个 HashMap,key 为 hashcode+statementId+sql 语句。
Value 为查询出来的结果集映射成的 java 对象。
SqlSession 执行 insert、update、delete 等操作 commit 后会清空该 SQLSession 缓存。

二级缓存是 mapper 级别的,Mybatis 默认是没有开启二级缓存的。
第一次调用 mapper 下的 SQL 去查询用户的信息,查询到的信息会存放在该 mapper 对应的二级缓存区域。
第二次调用 namespace 下的 mapper 映射文件中,相同的 sql 去查询用户信息,会去对应的二级缓存内取结果。

MySQL 主从同步

Master 数据库只要发生变化,立马记录到 Binary log 日志文件中
Slave 数据库启动一个 I/O thread 连接 Master 数据库,请求 Master 变化的二进制日志
Slave I/O 获取到的二进制日志,保存到自己的 Relay log 日志文件中。
Slave 有一个 SQL thread 定时检查 Realy log 是否变化,变化那么就更新数据

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
4月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
592 0
|
7月前
|
存储 SQL 关系型数据库
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
|
7月前
|
存储 关系型数据库 MySQL
MySQL数据库索引的数据结构?
MySQL中默认使用B+tree索引,它是一种多路平衡搜索树,具有树高较低、检索速度快的特点。所有数据存储在叶子节点,非叶子节点仅作索引,且叶子节点形成双向链表,便于区间查询。
224 4
|
9月前
|
存储 关系型数据库 MySQL
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
阿里面试:MySQL 一个表最多 加几个索引? 6个?64个?还是多少?
|
11月前
|
关系型数据库 MySQL 数据库
Mysql的索引
MYSQL索引主要有 : 单列索引 , 组合索引和空间索引 , 用的比较多的就是单列索引和组合索引 , 空间索引我这边没有用到过 单列索引 : 在MYSQL数据库表的某一列上面创建的索引叫单列索引 , 单列索引又分为 ● 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。 ● 唯一索引:索引列中的值必须是唯一的,但是允许为空值 ● 主键索引:是一种特殊的唯一索引,不允许有空值 ● 全文索引: 只有在MyISAM引擎、InnoDB(5.6以后)上才能使⽤用,而且只能在CHAR,VARCHAR,TEXT类型字段上使⽤用全⽂文索引。
|
7月前
|
存储 SQL 关系型数据库
MySQL 核心知识与索引优化全解析
本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分,阐述了 char 与 varchar 在存储方式和性能上的差异,以及事务的 ACID 特性、并发事务问题及对应的隔离级别(MySQL 默认 REPEATABLE READ)。 索引基础部分,详解了 InnoDB 默认的 B+tree 索引结构(多路平衡树、叶子节点存数据、双向链表支持区间查询),区分了聚簇索引(数据与索引共存,唯一)和二级索引(数据与索引分离,多个),解释了回表查询的概念及优化方法,并分析了 B+tree 作为索引结构的优势(树高低、效率稳、支持区间查询)。 索引优化部分,列出了索引创建的六大原则
186 2
|
8月前
|
存储 关系型数据库 MySQL
MySQL覆盖索引解释
总之,覆盖索引就像是图书馆中那些使得搜索变得极为迅速和简单的工具,一旦正确使用,就会让你的数据库查询飞快而轻便。让数据检索就像是读者在图书目录中以最快速度找到所需信息一样简便。这样的效率和速度,让覆盖索引成为数据库优化师傅们手中的尚方宝剑,既能够提升性能,又能够保持系统的整洁高效。
262 9
|
9月前
|
机器学习/深度学习 关系型数据库 MySQL
对比MySQL全文索引与常规索引的互异性
现在,你或许明白了这两种索引的差异,但任何技术决策都不应仅仅基于理论之上。你可以创建你的数据库实验环境,尝试不同类型的索引,看看它们如何影响性能,感受它们真实的力量。只有这样,你才能熟悉它们,掌握什么时候使用全文索引,什么时候使用常规索引,以适应复杂多变的业务需求。
245 12
|
10月前
|
SQL 存储 关系型数据库
MySQL选错索引了怎么办?
本文探讨了MySQL中因索引选择不当导致查询性能下降的问题。通过创建包含10万行数据的表并插入数据,分析了一条简单SQL语句在不同场景下的执行情况。实验表明,当数据频繁更新时,MySQL可能因统计信息不准确而选错索引,导致全表扫描。文章深入解析了优化器判断扫描行数的机制,指出基数统计误差是主要原因,并提供了通过`analyze table`重新统计索引信息的解决方法。
295 3
|
11月前
|
自然语言处理 关系型数据库 MySQL
MySQL索引有哪些类型?
● 普通索引:最基本的索引,没有任何限制。 ● 唯一索引:索引列的值必须唯一,但可以有空值。可以创建组合索引,则列值的组合必须唯一。 ● 主键索引:是特殊的唯一索引,不可以有空值,且表中只存在一个该值。 ● 组合索引:多列值组成一个索引,用于组合搜索,效率高于索引合并。 ● 全文索引:对文本的内容进行分词,进行搜索。

热门文章

最新文章

推荐镜像

更多