从一个问题出发,搞懂MySQL MVCC、readview、快照读和undo log是什么鬼

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 摸鱼的时候看到某技术群里有一个问题和下面的回复

摸鱼的时候看到某技术群里有一个问题和下面的回复,在讨论幻读与MySQL的快照读


问:大佬们为什么会产生幻读,是不是因为重新生成了readview?

首先明确一个定义,幻读是指多次查询时,查询到的数据数量出现了变化。

例如:第一次查询到了10行,第二次查询到了11行。

这种情况在MySQL的Read Committed(RC)隔离级别中会出现,在标准数据库定义中,Repeatable Read(RR)隔离级别中也会出现,MySQL通过快照读的方式避免了幻读。

和问题中所说的是不是因为readview导致的幻读,其实恰恰相反readview是MySQL实现快照读所生成的数据结构,但并不是说快照读就一定不会出现幻读,下面再细讲

A群友答:幻读只有在当前读才会出现,当前读读的是最新值,不是读的视图。

B群友答:读已提交的隔离级别下快照读也会造成现幻读

C群友答:要搞清楚幻读的概念, 仅在可重复读隔离级别的当前读

D群友答:RC RR都会出现幻读,需要靠间隙锁解决,光靠mvcc是解决不了幻读问题

其实我回复的是群友D的答案,其他只是在扣概念可以忽略,仅作为上下文阅读,但D的回答是明显有误的

详细说明

前面也提到MySQL是通过快照读避免幻读的,MySQL通过undo log,记录每次修改的回滚操作,可以理解成一条链表。

例如:

  • 原值A=1
  • 事务1,set A=2
  • 事务2,set A = 3
  • 事务3,set A= 4

那么链表上就有4个节点,1->2->3->4,并且节点上也会记录做这次修改的事务id,通过事务id和和undo log,我们就可以推算出可见的数据版本了。

image.png

可见性规则

在事务开始的时候,会记录当前未提交的所有事务id,这个就是提问中所说的readview

判断逻辑

从最新的版本开始判断,逻辑如下:

  • 当前版本如果比记录的所有事务id都大,即在当前事务开始的时候,该事务并未启动,所以一定不可见的。
  • 当前版本如果比记录的所有事务id都小即在当前事务开始的时候,该事务已提交,所以可见
  • 当前版本在readview中,即在当前事务开始的时候,该事务未提交,不可见
  • 当前版本不在readview中,即在当前事务考试的时候,该事务已提交,可见
  • 更新逻辑,因为更新不可能在快照上做更新,所以更新的时候是读取最新的数据上再做修改,且因为修改之后的undo log会记录自己的事务id,所以自己再次查询也是可见的

回到问题

RC和RR的差别在于,RC每次查询都会生成新的readviewRR只有事务开启的时候会生成readview,所以在RC隔离级别,是会产生幻读的,而在RR隔离级别,因为readview的存在,并不需要依赖锁机制去保障数据的可见性。

总结

对应标题总结一下:

  • MVCC:Multiversion concurrency control(多版本并发控制),是MySQL保障数据可见性的手段
  • 快照读:是MVCC下的具体读取操作
  • undo log:是快照读真正读取的快照数据
  • readview:是判断undo log可见性规则的依赖数据

嗯,没错,搁这套娃呢


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
29天前
|
存储 关系型数据库 MySQL
MySQL MVCC全面解读:掌握并发控制的核心机制
【10月更文挑战第15天】 在数据库管理系统中,MySQL的InnoDB存储引擎采用了一种称为MVCC(Multi-Version Concurrency Control,多版本并发控制)的技术来处理事务的并发访问。MVCC不仅提高了数据库的并发性能,还保证了事务的隔离性。本文将深入探讨MySQL中的MVCC机制,为你在面试中遇到的相关问题提供全面的解答。
96 2
|
2月前
|
SQL 存储 关系型数据库
美团面试:binlog、redo log、undo log的底层原理是什么?它们分别实现ACID的哪个特性?
老架构师尼恩在其读者交流群中分享了关于 MySQL 中 redo log、undo log 和 binlog 的面试题及其答案。这些问题涵盖了事务的 ACID 特性、日志的一致性问题、SQL 语句的执行流程等。尼恩详细解释了这些日志的作用、所在架构层级、日志形式、缓存机制以及写文件方式等内容。他还提供了多个面试题的详细解答,帮助读者系统化地掌握这些知识点,提升面试表现。此外,尼恩还推荐了《尼恩Java面试宝典PDF》和其他技术圣经系列PDF,帮助读者进一步巩固知识,实现“offer自由”。
美团面试:binlog、redo log、undo log的底层原理是什么?它们分别实现ACID的哪个特性?
|
29天前
|
存储 关系型数据库 MySQL
MySQL MVCC深度解析:掌握并发控制的艺术
【10月更文挑战第23天】 在数据库领域,MVCC(Multi-Version Concurrency Control,多版本并发控制)是一种重要的并发控制机制,它允许多个事务并发执行而不产生冲突。MySQL作为广泛使用的数据库系统,其InnoDB存储引擎就采用了MVCC来处理事务。本文将深入探讨MySQL中的MVCC机制,帮助你在面试中自信应对相关问题。
91 3
|
2月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1648 14
|
2月前
|
存储 SQL 关系型数据库
面试官:你能聊聊 binlog、undo log、redo log 吗?
本文详细解析了MySQL数据库中的三种日志:binlog、undo log和redo log。binlog用于记录数据库的所有表结构变更及数据修改,支持归档、主从复制和数据恢复;undo log用于事务回滚,确保事务的原子性和实现多版本控制;redo log则用于crash-safe,确保数据库异常重启后已提交记录不丢失。文章通过实例和图表,深入浅出地介绍了每种日志的特点、应用场景及其实现机制。适合数据库开发者和运维人员阅读。
95 2
|
3月前
|
关系型数据库 MySQL 数据库
MySQL高级篇——MVCC多版本并发控制
什么是MVCC、快照读与当前读、隐藏字段、Undo Log版本链、ReadView、举例说明、InnoDB 解决幻读问题
MySQL高级篇——MVCC多版本并发控制
|
2月前
|
存储 关系型数据库 MySQL
MySQL中的Redo Log、Undo Log和Binlog:深入解析
【10月更文挑战第21天】在数据库管理系统中,日志是保障数据一致性和完整性的关键机制。MySQL作为一种广泛使用的关系型数据库管理系统,提供了多种日志类型来满足不同的需求。本文将详细介绍MySQL中的Redo Log、Undo Log和Binlog,从背景、业务场景、功能、底层实现原理、使用措施等方面进行详细分析,并通过Java代码示例展示如何与这些日志进行交互。
92 0
|
3月前
|
SQL 关系型数据库 MySQL
初识 undo log
初识 undo log
34 0
|
3月前
|
存储 关系型数据库 MySQL
binlog、redolog、undo log底层原理及ACID特性实现分享
在数据库管理系统中,日志机制是确保数据一致性、完整性和可靠性的关键组件。MySQL数据库中的binlog、redolog和undolog作为其核心日志系统,各自扮演着不同但同样重要的角色。本文将深入探讨这三种日志的底层原理以及它们如何分别实现ACID(原子性、一致性、隔离性、持久性)特性的不同方面。
57 0
|
21天前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
161 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
下一篇
无影云桌面