深入理解MySQL的MVCC(多版本并发控制)实现原理

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 总结起来,MVVC技术使得MySQL能够有效地支持高并发环境中复杂交互要求; 然而合理配置及运维管理仍然关键确保系统长期稳健运转.

MySQL的多版本并发控制(MVCC)是一种用于提高数据库并发性能的技术,它允许在不锁定资源的情况下执行读取操作,同时保证事务隔离性。MVCC在InnoDB存储引擎中得到了广泛应用。

MVCC工作原理

1. 隐藏列和行版本控制

InnoDB为每行数据添加了三个隐藏列:DB_TRX_ID、DB_ROLL_PTR和DB_ROW_ID。其中,DB_TRX_ID记录最后修改该行数据的事务ID;DB_ROLL_PTR指向undo log记录;而当表没有主键或唯一非空索引时,InnoDB会使用隐藏的自增列DB_ROW_ID作为隐式主键。

2. Undo日志

当进行UPDATE或DELETE操作时,原始数据不会立即被覆盖或删除。相反,在修改之前会将原始数据复制到undo日志中。这样即使进行了更改,在事务提交之前其他事务仍然可以看到旧版本的数据。

3. Read View

Read View是一个逻辑视图概念,在READ COMMITTED和REPEATABLE READ两种隔离级别下工作方式略有不同。

  • 在READ COMMITTED模式下:每次查询开始时都创建一个新Read View。
  • 在REPEATABLE READ模式下:第一次查询时创建Read View,并在整个事务期间使用相同视图。

这个视图定义了哪些版本对当前读取操作是可见的:

  • 创建该视图时活跃(未提交)事务生成新版本对当前读取操作不可见。
  • 创建该视图后开始且已经结束(已提交) 的所有更改对当前读取都可见。

通过这种方式保证各个隔离级别能够正确实现其语义要求。

4. 多版并发控制规则

当执行SELECT语句来访问某些记录时:

  1. 如果记录最后被插入或更新所属于已经提交完成且比当前正在执行SELECT语句所属于那个早开启(小) 的那些transaction,则可以直接看到它;
  2. 如果比SELECT所属transaction晚开启(大) 或者还没结束,则需要通过undo log找回修改前(老) 的值;
  3. 对DELETE标记删除而未实际删除也适用上述规则来判断是否可见,并临床上加以处理以确保正确性;

MVCC优势与应用场景

MVCC允许多用户同时对数据库进行读写而互不干扰:

  1. 非阻塞性读 - SELECT查询通常无需等待其他写入完成即可获取信息;
    2.高效率写 - 写入只需添加新版信息至undo log, 而无须等待其他可能正在进行中阅览完毕;
    3.快照回滚支持 - 可以很容易地恢复至某特定时间点状态, 因为历史信息得以保存;

由此特点决定其广泛应用于需要高度并发处理与稳健稳态维护场景如在线交易平台、大型网站后台数据库等领域内部署使用.

思考与优化策略

虽然MVCC提供诸多好处, 然而也存在如幽灵问题、历史列表过长导致效率降低问题等挑战.
针对此类问题, 可采纳以下策略:
1.合理设置 innodb_history_list_length参数管理历史列表长度;
2.调整自动垃圾收集机制确保及早清除无需再维护老版;
3.根据业界标准及具体业态调整MySQL配置参数达成最佳平衡.

总结起来,MVVC技术使得MySQL能够有效地支持高并发环境中复杂交互要求; 然而合理配置及运维管理仍然关键确保系统长期稳健运转.

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
目录
相关文章
|
2月前
|
XML Java 数据格式
Bean的生命周期:从Spring的子宫到坟墓
Spring 管理 Bean 的生命周期,从对象注册、实例化、属性注入、初始化、使用到销毁,全程可控。Bean 的创建基于配置或注解,Spring 在容器启动时扫描并生成 BeanDefinition,按需实例化并填充依赖。通过 Aware 回调、初始化方法、AOP 代理等机制,实现灵活扩展。了解 Bean 生命周期有助于更好地掌握 Spring 框架运行机制,提升开发效率与系统可维护性。
|
2月前
|
存储 关系型数据库 MySQL
MySQL中的int(10)、char(10)与varchar(10)的类型和区别
在选择正确的数据类型时,需要仔细考虑每列的数据特点及应用程序的使用情况。合理的数据类型选择可以优化存储空间的使用,提高查询速度和数据库的整体性能。
358 14
|
2月前
|
Java
Java的CAS机制深度解析
CAS(Compare-And-Swap)是并发编程中的原子操作,用于实现多线程环境下的无锁数据同步。它通过比较内存值与预期值,决定是否更新值,从而避免锁的使用。CAS广泛应用于Java的原子类和并发包中,如AtomicInteger和ConcurrentHashMap,提升了并发性能。尽管CAS具有高性能、无死锁等优点,但也存在ABA问题、循环开销大及仅支持单变量原子操作等缺点。合理使用CAS,结合实际场景选择同步机制,能有效提升程序性能。
|
1月前
|
负载均衡 算法 Java
【SpringCloud(5)】Hystrix断路器:服务雪崩概念;服务降级、服务熔断和服务限流概念;使用Hystrix完成服务降级与服务熔断
多个微服务之间的调用,结社微服务A调用微服务B和微服务C,微服务B和微服务C有调用其他的微服务,这就是所谓的“扇出”如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所以的 “雪崩效应”
496 138
|
设计模式 Go
依赖注入实用指南:深入解析inject库
依赖注入实用指南:深入解析inject库
304 0
|
存储 关系型数据库 MySQL
MVCC多版本并发控制
MVCC多版本并发控制 1、MVCC MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。MVCC是一种并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问,在编程语言中实现事务内存。
736 0
|
2月前
|
运维 监控 关系型数据库
MySQL高可用方案:MHA与Galera Cluster对比
本文深入对比了MySQL高可用方案MHA与Galera Cluster的架构原理及适用场景。MHA适用于读写分离、集中写入的场景,具备高效写性能与简单运维优势;而Galera Cluster提供强一致性与多主写入能力,适合对数据一致性要求严格的业务。通过架构对比、性能分析及运维复杂度评估,帮助读者根据自身业务需求选择最合适的高可用方案。
|
9月前
|
存储 SQL 数据挖掘
数据无界、湖仓无界, Apache Doris 湖仓一体解决方案全面解读(上篇)
湖仓一体架构融合了数据湖的低成本、高扩展性,以及数据仓库的高性能、强数据治理能力,高效应对大数据时代的挑战。为助力企业实现湖仓一体的建设,Apache Doris 提出了数据无界和湖仓无界核心理念,并结合自身特性,助力企业加速从 0 到 1 构建湖仓体系,降低转型过程中的风险和成本。本文将对湖仓一体演进及 Apache Doris 湖仓一体方案进行介绍。
885 1
数据无界、湖仓无界, Apache Doris 湖仓一体解决方案全面解读(上篇)
|
关系型数据库 MySQL Linux
在CentOs7虚拟机Linux离线安装mysql5.6(亲测可用)
该博客文章详细记录了在CentOS 7虚拟机上离线安装MySQL 5.6版本的完整过程,包括下载安装包、导入虚拟机、卸载MariaDB、配置文件设置、服务启动和权限配置等步骤。
在CentOs7虚拟机Linux离线安装mysql5.6(亲测可用)