MySQL实战—更新过程

本文涉及的产品
对象存储 OSS,20GB 3个月
日志服务 SLS,月写入数据量 50GB 1个月
对象存储 OSS,恶意文件检测 1000次 1年
简介:

本文属于个人备忘录,主要是极客时间《MySQL实战45讲》学习笔记。

MySQL实战—更新过程

一条查询语句的执行过程一般是经过连接器、分析器、优化器、执行器等功能模块,最后到达存储引擎。那么更新语句又是如何执行?



和查询流程不同的是,更新流程涉及两个重要的日志模块:redo log(重做日志)和 binlog(二进制日志)。

redo log

redo log通常是物理日志,记录的是数据页的物理修改,而不是某一行或某几行的修改,它用来恢复提交后的物理数据页(恢复数据页,且只能恢复到最后一次提交的位置)。

如果MySQL每一次的更新操作都需要写进磁盘,整个过程IO成本会很高。使用redo log能提升更新效率,即WAL技术。

WAL

  • Write-Ahead Logging
  • 先写日志,再写磁盘

更新记录

  • InnoDB引擎先把记录写到redo log里面,并更新内存
  • InnoDB会在适当的时候,比如系统空闲时,将操作记录更新到磁盘里

在相同的数据量下,采用WAL的数据库系统在事务提交时,磁盘写操作只有传统的回滚日志的一半左右,大大提高了数据库磁盘IO操作的效率,从而提高了数据库的性能。

redo log

redo log大小固定,可配

  • 是InnoDB引擎的日志
  • 比如一组4个文件,每个文件大小1GB
  • 从头开始写,写到末尾又回到开始循环写
  • write pos是当前记录的位置,一边写一边后移,写到第 3 号文件末尾后就回到 0 号文件开头
  • checkpoint是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录更新到数据文件
  • write pos和checkpoint之间是可写部分,用来记录新的操作
  • 如果write pos追上Checkpoint,表示没有可写位置了,此时不能执行新的更新,需要停下来擦掉一些记录(将记录更新到磁盘),将checkpoint向前推进

image.png

crash-safe

  • 通过redo log,InnoDB保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为crash-safe

更新过程

以下述操作为例。

mysql> create table T(ID int primary key, c int);
mysql> update T set c=c+1 where ID=2;
AI 代码解读
  • 执行器通过引擎取ID=2这一行。

    • ID是主键,引擎直接用树搜索找到这一行
    • 如果ID=2这一行所在的数据页本来就在内存中,就直接返回给执行器;
    • 否则,需要先从磁盘读入内存,然后再返回。
  • 执行器将引擎返回的行数据的这个值加1,即N变成N+1,得到新的一行数据,再调用引擎接口写入新行。
  • 引擎将这行新数据更新到内存中,同时将这个更新操作记录到redo log里,此时redo log处于prepare状态。然后告知执行器执行完成了,随时可以提交事务。
  • 执行器生成这个操作的binlog,并把binlog写入磁盘。
  • 执行器调用引擎的提交事务接口,引擎把刚写入的redo log改成提交(commit)状态,更新完成。

执行流程如下图。浅色步骤在InnoDB内部执行,深色步骤在执行器中执行。

image.png

binlog

binlog,即二进制日志,是一个二进制文件,记录了对数据库执行更新的所有操作,并且记录了语句发生时间、执行时长、操作数据等信息。但不记录SELECT、SHOW等查询SQL语句。

二进制日志主要用于数据恢复和主从复制,及审计操作。

  • max_binlog_size:日志文件大小上限,二进制日志文件后缀名会由 mysql 自动拼接数字,达到此参数设置大小则写入另一个文件,同时后缀 + 1,所以在设置 log-bin 参数时仅填写路径和文件名即可,后缀名省略

是否开启binlog

log-bin:设置日志文件的位置,设置此参数同时开启日志记录,默认放在 mysql data目录下

mysql> show variables like 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin       | ON    |
+---------------+-------+
1 row in set (0.02 sec)
AI 代码解读

查看binlog

binlog不能直接查看。可以通过官方提供的mysqlbinlog工具查看。

  • 确认日志位置
mysql> show master logs;
+------------------+-----------+
| Log_name         | File_size |
+------------------+-----------+
| mysql-bin.000120 |  47533445 |
| mysql-bin.000121 |  57556996 |
| mysql-bin.000122 | 190963566 |
+------------------+-----------+
3 rows in set (0.01 sec)

mysql>
mysql>
mysql> show master status;
+------------------+-----------+--------------+------------------+--------------------------------------------------------------------------------------------------------------------------------------------------+
| File             | Position  | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set                                                                                                                                |
+------------------+-----------+--------------+------------------+--------------------------------------------------------------------------------------------------------------------------------------------------+
| mysql-bin.000122 | 190964654 |              |                  | a30ccda1-22af-11e9-850a-6c92bf668356:4512526-4520657,
df123bc8-3139-11ea-9587-6c92bf9bf658:1-6937,
e001bcc0-3139-11ea-a763-ac853d9f52c8:1-801427 |
+------------------+-----------+--------------+------------------+--------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
AI 代码解读
  • 输出文件内容
# 直接查看
mysqlbinlog mysql-bin.xxx  //xxx表示文件编号

# 输出到指定文件
mysqlbinlog mysql-bin.xxx > mysqllog.log

# 指定时间段输出
mysqlbinlog --start-datetime '2020-01-08 00:00:00' --stop-datetime '2020-01-08 01:00:00' mysql-bin.xxx > mysqllog.log
AI 代码解读

如果执行过程出现以下提示,可暂时添加--no-defaults参数跳过检查。

mysqlbinlog:[ERROR] unknown variable 'default-character-set=utf8'
AI 代码解读

更多内容,请参考https://dev.mysql.com/doc/refman/5.7/en/binary-log.html

两阶段提交

写入redo log分为两个步骤

  • prepare
  • commit

即,两阶段提交。

为什么需要两阶段提交?

redo log和binlog是两个独立的逻辑,如果不用两阶段提交,要么就是先写完redo log再写binlog,要么反过来。

以上述更新为例。假设当前ID=2,字段c的值为0,并假设执行update过程中写完第一个日志后,发生了crash。看看两种方式会发生什么情况。

  • 先写redo log后写binlog

    • 假设redo log写完,binlog没有写完的时候,MySQL 进程异常重启
    • redo log写完之后,系统即使崩溃,仍然能够把数据恢复回来,所以恢复后这一行c的值是 1
    • 但由于binlog没写完就crash了,这时候binlog里面就没有记录这个语句。因此,之后备份日志的时候,存起来的binlog里面就没有这条语句。
    • 如果需要用这个binlog来恢复临时库的话,由于这个语句的binlog丢失,这个临时库就会少了这一次更新,恢复出来的这一行c的值就是0,与原库的值不同。
    • 出现不一致
  • 先写binlog后写redo log

    • 假设binlog写完之后,redo log没有写完的时候crash
    • 由于redo log还没写,崩溃恢复以后这个事务无效,所以这一行c的值是0。
    • 但是 binlog 里面已经记录了“把c从0改成1”这个日志。
    • 后续用binlog恢复的时候就多了一个事务出来,恢复出来的这一行c的值就是 1,与原库的值不同。
    • 也出现不一致

可以看出,如果不使用“两阶段提交”,数据库的状态有可能和用binlog恢复出来的库的状态不一致。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
1
0
0
3038
分享
相关文章
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
533 66
PHP与MySQL动态网站开发实战指南####
【10月更文挑战第21天】 本文将深入浅出地探讨如何使用PHP与MySQL构建一个动态网站,从环境搭建到项目部署,全程实战演示。无论你是编程新手还是希望巩固Web开发技能的老手,都能在这篇文章中找到实用的技巧和启发。我们将一起探索如何通过PHP处理用户请求,利用MySQL存储数据,并最终呈现动态内容给用户,打造属于自己的在线平台。 ####
322 0
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
250 22
 MySQL秘籍之索引与查询优化实战指南
PHP与MySQL动态网站开发实战指南####
——深入探索LAMP栈下的高效数据交互与处理技巧 ####
PHP与MySQL动态网站开发实战指南####
深入探索PHP与MySQL的协同工作机制,本文旨在通过一系列实战案例,揭示构建高效、稳定且用户友好的动态网站的秘诀。从环境搭建到数据交互,再到最佳实践分享,本文为开发者提供了一条清晰的学习路径,助力其在LAMP(Linux, Apache, MySQL, PHP/Perl/Python)栈上实现技术飞跃。 ####
PHP与MySQL动态网站开发实战指南####
本文深入探讨了PHP与MySQL在动态网站开发中的应用实践,通过具体案例解析如何高效结合这两大技术构建数据驱动的Web应用。文章将涵盖环境搭建、基础语法回顾、数据库设计与操作、用户注册与登录系统实现等关键步骤,旨在为开发者提供一个从零到一的项目实战路径,展示PHP与MySQL协同工作的强大能力。 ####
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
1024 1
MySQL与Redis协同作战:优化百万数据查询的实战经验
【10月更文挑战第13天】 在处理大规模数据集时,传统的关系型数据库如MySQL可能会遇到性能瓶颈。为了提升数据处理的效率,我们可以结合使用MySQL和Redis,利用两者的优势来优化数据查询。本文将分享一次实战经验,探讨如何通过MySQL与Redis的协同工作来优化百万级数据统计。
458 5
MySQL最左前缀优化原则:深入解析与实战应用
【10月更文挑战第12天】在数据库架构设计与优化中,索引的使用是提升查询性能的关键手段之一。其中,MySQL的最左前缀优化原则(Leftmost Prefix Principle)是复合索引(Composite Index)应用中的核心策略。作为资深架构师,深入理解并掌握这一原则,对于平衡数据库性能与维护成本至关重要。本文将详细解读最左前缀优化原则的功能特点、业务场景、优缺点、底层原理,并通过Java示例展示其实现方式。
333 1

云存储

+关注

推荐镜像

更多
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问