【MySQL】索引和事务重点知识汇总

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 【MySQL】索引和事务重点知识汇总

1.索引:

  1. 索引存在的意义就是为了提高查询到效率.
  2. 索引的作用就类似与一本书的目录,通过目录就可以快速找到想要的内容.如果没有目录就只能一页一页的翻(遍历).
  3. 使用索引付出的代价(有得就有失): a)消耗了更多的空间,b)虽然提高了查找效率,但是降低了增删改的效率(因为插入修改记录,不仅需要修改硬盘的数据还要调整索引).
  4. 虽然索引有一些代价但是仍然认为还是值得使用索引的,因为大多数情况下查询的频率是高于增删改的.

1.1 索引的使用:

  1. 对于生产环境上比较大的表,一般都是建表之初就把索引都规划好,这样就会避免很多的低效操作.
  2. 查看索引, show index from 表名;
  3. 创建索引, create index 索引名 on 表名(列名);
  4. 创建索引是一个低效的操作,如果表里的数据少,那么创建索引开销就不大;如果表里的数据很多,创建索引操作就会非常的耗时并且带来大量的硬盘IO,甚至会卡死数据库.
  5. 创建索引的时候也会创建出一些相关的数据结构.
  6. 删除索引, drop index 索引名 on 表名;
  7. 删除操作和刚才的创建操作类似都是比较低效的操作.

1.2 索引背后的核心数据结构:

哪些数据结构可以提高查找的效率:

1.哈希表, 增删查改都是O(1)

只能查询 值 相等的情况,但是如果是 < > between and 这类比较大小的范围查询就不行

2.二叉树 / 二叉搜索树, 查询速度最差是O(N)

AVL树 / 红黑树 (比较平衡的二叉搜索树) O(logN)

如果数据库数据特别多,上面的树就会比较的高 O(logN)

程序猿为了数据库索引量身定做了一个专门的数据结构 B+ 树.

1.2.1 先认识 B 树(N叉搜索树):

B树是一个N叉搜索树.每个节点上可能会包含N-1个值(也可能更少), N-1个值就把区间划分成了N份.这样分成N个叉的意义就是表示同样的数据集合的时候,比二叉树的高度要小很多,IO次数就降低了不少!

1.2.2 再认识 B+ 树(N叉搜索树):

B 树 B+ 树
B树每个节点N-1个值,就分出了N个区间 B+树N个值分成N个区间
B树中的值不会重复出现 B+树是可能重复出现的 (父元素的值会在子元素中以最大值/最小值的姿态出现)
叶子节点这里,B+树会把所有的叶子节点以链表的形式首尾相连,这个时候非常便于范围查找
正因为叶子节点是全集数据,只需要把每一行(每一条记录的完整的所有列关联到叶子节点上即可);非叶子节点只需要保存索引列(只存个id);
非叶子节点占用空间非常小(相比于完整的数据集合),就可以在内存中缓存.因此这个时候查询就又进一步的减少硬盘IO.

2.事务:

  1. 事务就是用来保证原子性的.
  2. 原子性: 原子是不可分割的最小单位,使用原子来表示不能分割的基本单位.
  3. 数据库里面也有一些操作希望可以按照原子的方式来执行,这种情况下就可以使用"事务"来实现
  4. 类似于转账操作就需要按照原子的方式来完成,要么执行全都执行完,要么都不执行(这里说的不执行不是真的没执行,而是执行一半如果出现问题可以自动的恢复如初)
  5. 事务就能保证,当执行过程中出现问题的时候,自动的把前面的SQL执行的效果进行还原,恢复如初,这个操作叫做回滚(rollback);
  6. 事务执行的过程中, MySQL会记录每一步都执行了啥,一旦出现问题就可以根据记录来回滚.
  7. 既然可以回档, 为什么没有撤回呢? 为了实现事务, 其实需要付出很大的代价! 如果想要实现撤回的话, 意味着每一步都要付出这些代价. 撤回操作不是实现不了, 而是代价太大了, 不划算!
  8. 事务最核心的就是原子性, 事务的开启/提交/回滚,一般都是通过代码来控制的.
  9. 四个特性:
4个特性 解释
原子性 这就是事务存在的意义!, 能够把多个SQL打包成一个整体,要么全都执行完,要么一个都不执行(如果执行过程中出错,则自动回滚)
一致性 事务执行前后,数据处在一致的状态, (数据能够对的上)
持久性 事务进行的改动都是写到硬盘上的,不会随着程序重启/主机重启而丢失
隔离性 多个事务并发执行的时候,事务之间能够保持"隔离",不会相互干扰

2.1 隔离性:

  1. 并发执行, 简单的理解就是同时做很多件事情.并发执行事务可能存在问题,就需要隔离性.
  2. 隔离性存在的意义就是让并发执行事务的过程中,尽量不出问题(问题在可控范围之内)

2.1.1 脏读问题:

  1. 想象一个场景, 室友问我要作业,我把修改之前的作业发给他, 他用了之后,我把作业给改了.
  2. 上述就是一个脏读问题, 脏读数据就是一个临时的数据, 不代表最终的结果.
  3. 脏读: 一个事务A在修改数据,提交之前,另外一个事务B读取了数据,此时A极有可能在提交的时候把数据给改了.此时事务B读到的就是"无效的数据"就称为脏读, 读到了脏数据.
  4. 如何解决脏读问题: 结合上述场景,我就和室友约定好, 等我作业写好了再来找我要.在我写好之前,你们不要问我要! 这个操作就相当于是对 写操作加锁!
  5. 写加锁之前, 我的写操作和室友的读操作,就是完全并发的,此时并发是最高的,隔离性是最低的!
  6. 写加锁之后,我写作业的时候,室友就不能问我要,并发性降低了, 但是隔离性提高了!
  7. 但是这又引入了新的问题, 不可重复读!

2.1.2 不可重复读问题:

  1. 概念: 在一个事务A中,多次读取同一个数据发现不一样!!! (读的过程中数据被人修改了)
  2. 想象一个场景, 由于约定过写加锁, 室友在看我作业的时候,我又有了新的想法就把作业又给改了, 这个时候我再次发给室友, 他们就发现作业变了! , 这个过程就是不可重复读的问题.
  3. 不可重复读需要使用读加锁来解决, 我和室友约定我写作业的时候,你们不要问我要; 同时室友看我作业的时候, 我也不要去改.
  4. 随着引入读加锁,并发程度又进一步的降低了(效率降低),隔离性又提高了(数据准确性也提高了).

2.1.3 幻读问题:

  1. 想象一个场景, 刚刚和室友约定了写加锁和读加锁, 我还是闲不住, 室友读取文件A的时候, 我去修改文件B/新增删除文件…,只要不影响到大家正在读的那个数据就好了呀!(我是这么想的)
  2. 这样做虽然同学们直接读取的数据没有影响, 但是同学们会发现,俩次读虽然关系的数据一样但是结果集变了.(第一次大家只能看到一个.java文化,现在看到了俩个.java文件)
  3. 上面这种情况称之为幻读问题, 可以看成是不可重复读的特殊情况.
  4. 为了解决幻读问题, 我和室友约定好,他们读数据的时候,我就得关上电脑就要去摸鱼,作业一点都不能碰!
  5. 此时并发程度最低了(串行执行的了)效率是最低的, 隔离性是最高的,数据的准确性最高!

2.1.4 总结:

  1. 上述的脏读问题,不可重复读问题,幻读问题. 都是在并发执行事务中, 可能带来的影响.产生这些影响不一定是bug.
  2. 如果需求对于数据精度要求不高,上述问题就不是bug,因此就可以让并发程度高一点,隔离性低一点,提高效率!
  3. 如果需求对于精度要求很高,上述问题就是可能是bug,因此就需要rag并发程度低一点,隔离性高一点,保证数据的可靠性!
  4. 类似于转账,必须要精度很高,效率低一点都没事.
  5. 类似于抖音点赞/投币数,精度要求就不高.

2.1.5 隔离级别:

MySQL提供了隔离级别这个选项,给了四个档位, 让我们根据实际需求来选择不同的档位. 在MySQL的配置文件中 my.ini 进行配置,根据不同的需求场景,就可以分别设置不同的档位了.

选项 说明
read uncommitted 允许读未提交的数据,并发程度最高,隔离性最低,可能存在脏读/不可重复读/幻读问题
read committed 只能读取提交之后的数据, 相当于是写加锁,并发程度降低,隔离性提高,解决了脏读问题
repeatable read (默认) 相当于写加锁和读加锁了, 并发程度再次降低,隔离性再提高,解决了脏读/不可重复读问题
serializable 严格执行串行化, 并发程度最低,隔离性最高,解决了脏读/不可重复读/幻读问题,效率最低
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6天前
|
存储 关系型数据库 MySQL
MySQL基础:索引
MySQL中的索引是一种数据结构,能大幅提升数据库查询效率和减少I/O成本,类似于书的目录帮助快速定位内容。其优势包括提高检索效率和降低排序成本,但会占用空间并影响更新表的效率。鉴于查询远多于更新,索引仍被推荐使用。索引分为多种类型,如B+树和哈希索引,其中B+树因其较低的高度和稳定的查询开销成为常用选择。创建和删除索引需谨慎,以免影响性能。
27 4
MySQL基础:索引
|
4天前
|
SQL 关系型数据库 MySQL
MySQL基础:事务
本文详细介绍了数据库事务的概念及操作,包括事务的定义、开启、提交与回滚。事务作为一组不可分割的操作集合,确保了数据的一致性和完整性。文章还探讨了事务的四大特性(原子性、一致性、隔离性、持久性),并分析了并发事务可能引发的问题及其解决方案,如脏读、不可重复读和幻读。最后,详细讲解了不同事务隔离级别的特点和应用场景。
33 4
MySQL基础:事务
|
22天前
|
缓存 关系型数据库 MySQL
在Linux中,如何优化MySQL性能,包括索引优化和查询分析?
在Linux中,如何优化MySQL性能,包括索引优化和查询分析?
|
22天前
|
SQL 关系型数据库 MySQL
MySQL索引你用对了吗?
本文从遇到的问题出发,分析了tddl优化器、MySQL索引、分表拆分键的选择相关知识。
|
22天前
|
SQL 关系型数据库 MySQL
Mysql原理与调优-事务与MVCC
【8月更文挑战第19天】
|
11天前
|
API C# 开发框架
WPF与Web服务集成大揭秘:手把手教你调用RESTful API,客户端与服务器端优劣对比全解析!
【8月更文挑战第31天】在现代软件开发中,WPF 和 Web 服务各具特色。WPF 以其出色的界面展示能力受到欢迎,而 Web 服务则凭借跨平台和易维护性在互联网应用中占有一席之地。本文探讨了 WPF 如何通过 HttpClient 类调用 RESTful API,并展示了基于 ASP.NET Core 的 Web 服务如何实现同样的功能。通过对比分析,揭示了两者各自的优缺点:WPF 客户端直接处理数据,减轻服务器负担,但需处理网络异常;Web 服务则能利用服务器端功能如缓存和权限验证,但可能增加服务器负载。希望本文能帮助开发者根据具体需求选择合适的技术方案。
40 0
|
11天前
|
C# Windows 监控
WPF应用跨界成长秘籍:深度揭秘如何与Windows服务完美交互,扩展功能无界限!
【8月更文挑战第31天】WPF(Windows Presentation Foundation)是 .NET 框架下的图形界面技术,具有丰富的界面设计和灵活的客户端功能。在某些场景下,WPF 应用需与 Windows 服务交互以实现后台任务处理、系统监控等功能。本文探讨了两者交互的方法,并通过示例代码展示了如何扩展 WPF 应用的功能。首先介绍了 Windows 服务的基础知识,然后阐述了创建 Windows 服务、设计通信接口及 WPF 客户端调用服务的具体步骤。通过合理的交互设计,WPF 应用可获得更强的后台处理能力和系统级操作权限,提升应用的整体性能。
27 0
|
11天前
|
存储 关系型数据库 MySQL
MySQL 中的事务存储引擎深入解析
【8月更文挑战第31天】
11 0
|
11天前
|
SQL 关系型数据库 MySQL
SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
70 0
|
12天前
|
SQL 关系型数据库 MySQL
深入探索MySQL索引策略
本文旨在深入探讨MySQL(8.0.26)数据库中索引的设计与优化方法。

热门文章

最新文章