MySQL之深入InnoDB存储引擎——Checkpoint机制

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 一、引入由于页的操作首先都是在缓冲池中完成的,那么如果一条DML语句改变了页中的记录,那么此时页就是脏的,即缓冲池中页的版本要比磁盘的新。那么数据库需要将新版本的页刷新到磁盘。倘若每次一个页发生变化就刷新,那么开销会很大,若热点数据集中在某几个页中,那么数据库的性能将变得非常差。

一、引入

由于页的操作首先都是在缓冲池中完成的,那么如果一条DML语句改变了页中的记录,那么此时页就是脏的,即缓冲池中页的版本要比磁盘的新。那么数据库需要将新版本的页刷新到磁盘。倘若每次一个页发生变化就刷新,那么开销会很大,若热点数据集中在某几个页中,那么数据库的性能将变得非常差。  

同时如果在缓冲池将新版本的页刷新到磁盘时发生了宕机,那么数据就不能恢复了。为了避免发生数据丢失的问题,当前事务数据库普遍都采用了 Write Ahead Log 策略,即当事务提交时,先写重做日志,再修改页。当由于发生宕机而导致数据丢失时,通过重做日志来完成数据的恢复,从而满足事务的持久性要求。


如果说重做日志可以无限地增大,同时缓冲池也足够大,能够缓冲所有数据库的数据,那么是不需要将缓冲池中页的新版本刷回磁盘。因为发生宕机时完全可以通过重做日志来恢复数据库系统的数据到宕机发生的情况。然而现实是这两个条件是很难满足的,即使满足了,那么如果数据库运行了很久后发生宕机,那么使用重做日志进行恢复的时间也会非常的久。即缓冲池的容量和重做日志容量是有限的,所以需要定期将脏页刷回磁盘,在这样的情况下,引入了 Checkpoint(检查点)技术。


所谓 Checkpoint,是指一个触发点(时间点),当发生 Checkpoint 时,会将脏页(数据脏页和日志脏页)写回磁盘。总的来说,Checkpoint 是数据库管理系统中的一个操作,用于将脏页刷新到磁盘,以确保数据的持久性和一致性。

二、LSN

LSN 称为日志的逻辑序列号(log sequence number),是日志空间中每条日志的结束点,用字节偏移量来表示。在 InnoDB 存储引擎中,LSN 占8个字节,LSN 的值会随着日志的写入而逐渐变大。除了重做日志,每个页(在每个数据页的头部 FILE_HEADER 部分,有一个 FIL_PAGE_LSN 记录了该数据页最后被修改的日志序列位置)以及 Checkpoint 也会被分配一个LSN,以便在需要时可以按照顺序进行检索和恢复。

即 Checkpoint 是通过LSN实现,其由一个 LSN 表示,用来记录已经刷回磁盘的最新页的版本

可以通过show engine innodb status来观察 redo log 里的 checkpoint,结果如下:

......
---
LOG
---
Log sequence number          38890249625                                                                                                                                             
Log buffer assigned up to    38890249625                                                                                                                                             
Log buffer completed up to   38890249625                                                                                                                                             
Log written up to            38890249625                                                                                                                                             
Log flushed up to            38890249625                                                                                                                                             
Added dirty pages up to      38890249625                                                                                                                                             
Pages flushed up to          38890249625                                                                                                                                             
Last checkpoint at           38890249625  
......

log sequence number 就是当前的 redo log (in buffer) 中的 LSN;

log flushed up to 是刷到 redo log file 磁盘数据中的 LSN;

pages flushed up to 是下一次即将做 checkpoint lsn 的位置,如果没有新数据写入则取 lsn 的值

last checkpoint at 是上一次检查点所在位置的 LSN。

当我们执行一条修改语句时,InnoDB 存储引擎的执行过程大概如下:


首先修改内存中的数据页,并在数据页中记录 LSN

在修改数据页的同时向 redo log in buffer 中写入 redo log,并记录下 LSN

写完 buffer 中的日志之后,当触发了日志刷盘的几种规则时,会向 redo log file on disk 刷入 redo 日志,并在该文件中记录下对应的 LSN

数据页不可能永远只停留在内存中,在某些情况下,会触发 checkpoint来 将内存中的脏页(数据脏页和日志脏页)刷到磁盘,所以会在本次 **checkpoint 脏页刷盘结束时,在 redo log 中记录 checkpoint 的 LSN 位置。**在 Checkpoint 完成之后,checkpoint LSN 之前的 Redo Log 就不再需要了

要刷入所有的数据页需要一定的时间来完成,中途刷入的每个数据页都会记下当前页所在的 LSN。

23f03bc6125d41a3b48b0ac6124c1d65.png


MySQL 在崩溃恢复时,会从重做日志 redo-log 的 Checkpoint 处开始执行重放操作。 它从 last Checkpoint 对应的 LSN 开始扫描 redo-log 日志,并将其应用到 buffer-pool 中,直到 last Checkpoint 对应的 LSN 等于 log flushed up to 对应的 LSN (也就是 redo-log 磁盘上存储的 LSN 值),则恢复完成 。

三、触发时机

Checkpoint 所做的事情无外乎是将缓冲池中的脏页刷回到磁盘,不同之处在于每次刷新多少页到磁盘,每次从哪里获取脏页,以及什么时间触发 Checkpoint。在 InnoDB 内部有两种 Checkpoint,分别为:


Sharp Checkpoint

Fuzzy Checkpoint

Sharp Checkpoint 发送在数据库关闭时将所有的脏页都刷新回磁盘,这是默认的工作方式,即参数 innodb_fast_shutdown=1。


但是若数据库在运行时也使用 Sharp Checkpoint,那么数据库的可用性就会受到很大影响。所以 InnoDB 存储引擎内部使用 Fuzzy Checkpoint 进行页的刷新,即每次只刷新一部分脏页。


InnoDB 存储引擎中可能发生时会触发 Fuzzy Checkpoint:


Master Thread Checkpoint:Master Thread 差不多以每秒或每十秒的速度从缓冲池的脏页列表中刷新一定比例的页回磁盘,这个过程是异步的,不会阻塞其他操作。


FLUSH_LRU_LIST Checkpoint:Buffer Pool 的 LRU 列表需要保留一定数量的空闲页面,来保证 Buffer Pool 中有足够的空间应对新的数据库请求。在空闲列表不足时,移除LRU列表尾端的页,若移除的页为脏页,则需要进行 Checkpoint。空闲数量阈值是可以配置的(默认是1024),这个检查在一个单独的 Page Cleaner 线程中进行。


Async/Sync Flush Checkpoint:当重做日志不可用(即 redo log 写满)时,需要强制将一些页刷新回磁盘,此时脏页从脏页列表中获取。


定义 checkpoint_age = redo_log_in_buffer_lsn - checkpoint_lsn,即有多少脏页还未刷回磁盘

定义 async_water_mark = 0.75 * total_redo_log_file_size,sync_water_mark = 0.9 * total_redo_log_file_size

如果 checkpoint_age < async_water_mark,那么不需要刷新任何脏页回磁盘

如果 async_water_mark < checkpoint_age < sync_water_mark,那么触发 Async Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark

如果 checkpoint_age > sync_water(种情况一般很少见,除非设置的重做日志文件太小),那么触发 Sync Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark

旧版本中 Async Flush 会阻塞发现问题的用户查询线程,Sync Flush 会阻塞所有查询线程,新版本中在独立的 Page Cleaner Thread 中执行,不会阻塞

Dirty Page too much Checkpoint:当脏页数量太多时会强制推进 Checkpoint,以保证缓冲区有足够的空闲页。innodb_max_dirty_pages_pct 的默认值为75,表示当缓冲池脏页比例达到该值时,就会强制进行 Checkpoint,刷新一部分脏页到磁盘。


参考资料:


LSN、Checkpoint?MySQL的崩溃恢复是怎么做的? - 脉脉 (maimai.cn)


MySQL 引擎特性 · InnoDB LSN 详解 (log sequence number) - 知乎 (zhihu.com)


谈谈MySQL的WAL、LSN、checkpoint - 知乎 (zhihu.com)

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
16天前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
本文介绍了MySQL InnoDB存储引擎中的数据文件和重做日志文件。数据文件包括`.ibd`和`ibdata`文件,用于存放InnoDB数据和索引。重做日志文件(redo log)确保数据的可靠性和事务的持久性,其大小和路径可由相关参数配置。文章还提供了视频讲解和示例代码。
125 11
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
|
2月前
|
存储 SQL 关系型数据库
MySQL存储引擎
本文介绍了数据库优化的多个方面,包括选择合适的存储引擎、字段定义原则、避免使用外键和触发器、大文件存储策略、表拆分及字段冗余处理等。强调了从业务层面进行优化的重要性,如通过活动设计减少外部接口调用,以及在高并发场景下的流量控制与预处理措施。文章还提供了具体的SQL优化技巧和表结构优化建议,旨在提高数据库性能和可维护性。
MySQL存储引擎
|
16天前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的表空间
InnoDB是MySQL默认的存储引擎,主要由存储结构、内存结构和线程结构组成。其存储结构分为逻辑和物理两部分,逻辑存储结构包括表空间、段、区和页。表空间是InnoDB逻辑结构的最高层,所有数据都存放在其中。默认情况下,InnoDB有一个共享表空间ibdata1,用于存放撤销信息、系统事务信息等。启用参数`innodb_file_per_table`后,每张表的数据可以单独存放在一个表空间内,但撤销信息等仍存放在共享表空间中。
|
16天前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的段、区和页
MySQL的InnoDB存储引擎逻辑存储结构与Oracle相似,包括表空间、段、区和页。表空间由段和页组成,段包括数据段、索引段等。区是1MB的连续空间,页是16KB的最小物理存储单位。InnoDB是面向行的存储引擎,每个页最多可存放7992行记录。
|
16天前
|
存储 缓存 关系型数据库
【赵渝强老师】MySQL的MyISAM存储引擎
在MySQL5.1版本之前,默认存储引擎为MyISAM。MyISAM管理非事务表,提供高速存储和检索,支持全文搜索。其特点包括不支持事务、表级锁定、读写互阻、仅缓存索引等。适用于读多、写少且对一致性要求不高的场景。示例代码展示了MyISAM存储引擎的基本操作。
|
16天前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL的InnoDB存储引擎
InnoDB是MySQL的默认存储引擎,广泛应用于互联网公司。它支持事务、行级锁、外键和高效处理大量数据。InnoDB的主要特性包括解决不可重复读和幻读问题、高并发度、B+树索引等。其存储结构分为逻辑和物理两部分,内存结构类似Oracle的SGA和PGA,线程结构包括主线程、I/O线程和其他辅助线程。
【赵渝强老师】MySQL的InnoDB存储引擎
|
16天前
|
存储 关系型数据库 MySQL
【赵渝强老师】MySQL的Memory存储引擎
MySQL 的存储引擎层负责数据的存储和提取,支持多种存储引擎,如 InnoDB、MyISAM 和 Memory。InnoDB 是最常用的存储引擎,从 MySQL 5.5.5 版本起成为默认引擎。Memory 存储引擎的数据仅存在于内存中,重启后数据会丢失。示例中创建了使用 Memory 引擎的 test3 表,并展示了数据在重启后消失的过程。
|
2月前
|
存储 SQL 缓存
MySQL存储引擎如何完成一条更新语句的执行!
MySQL存储引擎如何完成一条更新语句的执行!
MySQL存储引擎如何完成一条更新语句的执行!
|
3月前
|
存储 缓存 关系型数据库
MySQL高级篇——存储引擎和索引
MyISAM:不支持外键和事务,表锁不适合高并发,只缓存索引,内存要求低,查询快MyISAM提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但MyISAM不支持事务、行级锁、外键,有一个毫无疑问的缺陷就是崩溃后无法安全恢复。5.5之前默认的存储引擎优势是访问的速度快,对事务完整性没有要求或者以SELECT、INSERT为主的应用针对数据统计有额外的常数存储。故而 count(*) 的查询效率很高表名.frm 存储表结构;表名.MYD 存储数据 (MYData);
MySQL高级篇——存储引擎和索引
|
2月前
|
存储 缓存 关系型数据库
详细解析MySQL中的innodb和myisam
总之,InnoDB和MyISAM各有千秋,选择合适的存储引擎应基于对应用程序特性的深入理解,以及对性能、数据完整性和可扩展性的综合考量。随着技术发展,InnoDB因其全面的功能和日益优化的性能,逐渐成为更广泛场景下的首选。然而,在特定条件下,MyISAM依然保留其独特的价值。
129 0

热门文章

最新文章

下一篇
无影云桌面