MySQL之深入InnoDB存储引擎——Checkpoint机制

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS AI 助手,专业版
RDS Agent(兼容OpenClaw),2核4GB
简介: 一、引入由于页的操作首先都是在缓冲池中完成的,那么如果一条DML语句改变了页中的记录,那么此时页就是脏的,即缓冲池中页的版本要比磁盘的新。那么数据库需要将新版本的页刷新到磁盘。倘若每次一个页发生变化就刷新,那么开销会很大,若热点数据集中在某几个页中,那么数据库的性能将变得非常差。同时如果在缓冲池将新版本的页刷新到磁盘时发生了宕机,那么数据就不能恢复了。为了避免发生数据丢失的问题,当前事务数据库普遍都采用了 Write Ahead Log 策略,即当事务提交时,先写重做日志,再修改页。当由于发生宕机而导致数据丢失时,通过重做日志来完成数据的恢复,从而满足事务的持久性要求。

一、引入

由于页的操作首先都是在缓冲池中完成的,那么如果一条DML语句改变了页中的记录,那么此时页就是脏的,即缓冲池中页的版本要比磁盘的新。那么数据库需要将新版本的页刷新到磁盘。倘若每次一个页发生变化就刷新,那么开销会很大,若热点数据集中在某几个页中,那么数据库的性能将变得非常差。


同时如果在缓冲池将新版本的页刷新到磁盘时发生了宕机,那么数据就不能恢复了。为了避免发生数据丢失的问题,当前事务数据库普遍都采用了 Write Ahead Log 策略,即当事务提交时,先写重做日志,再修改页。当由于发生宕机而导致数据丢失时,通过重做日志来完成数据的恢复,从而满足事务的持久性要求。


如果说重做日志可以无限地增大,同时缓冲池也足够大,能够缓冲所有数据库的数据,那么是不需要将缓冲池中页的新版本刷回磁盘。因为发生宕机时完全可以通过重做日志来恢复数据库系统的数据到宕机发生的情况。然而现实是这两个条件是很难满足的,即使满足了,那么如果数据库运行了很久后发生宕机,那么使用重做日志进行恢复的时间也会非常的久。即缓冲池的容量和重做日志容量是有限的,所以需要定期将脏页刷回磁盘,在这样的情况下,引入了 Checkpoint(检查点)技术。


所谓 Checkpoint,是指一个触发点(时间点),当发生 Checkpoint 时,会将脏页(数据脏页和日志脏页)写回磁盘。总的来说,Checkpoint 是数据库管理系统中的一个操作,用于将脏页刷新到磁盘,以确保数据的持久性和一致性。


二、LSN

LSN 称为日志的逻辑序列号(log sequence number),是日志空间中每条日志的结束点,用字节偏移量来表示。在 InnoDB 存储引擎中,LSN 占8个字节,LSN 的值会随着日志的写入而逐渐变大。除了重做日志,每个页(在每个数据页的头部 FILE_HEADER 部分,有一个 FIL_PAGE_LSN 记录了该数据页最后被修改的日志序列位置)以及 Checkpoint 也会被分配一个LSN,以便在需要时可以按照顺序进行检索和恢复。


即 Checkpoint 是通过LSN实现,其由一个 LSN 表示,用来记录已经刷回磁盘的最新页的版本。


可以通过show engine innodb status来观察 redo log 里的 checkpoint,结果如下:


......
---
LOG
---
Log sequence number          38890249625                                                                                                                                             
Log buffer assigned up to    38890249625                                                                                                                                             
Log buffer completed up to   38890249625                                                                                                                                             
Log written up to            38890249625                                                                                                                                             
Log flushed up to            38890249625                                                                                                                                             
Added dirty pages up to      38890249625                                                                                                                                             
Pages flushed up to          38890249625                                                                                                                                             
Last checkpoint at           38890249625  
......


  • log sequence number 就是当前的 redo log (in buffer) 中的 LSN;
  • log flushed up to 是刷到 redo log file 磁盘数据中的 LSN;
  • pages flushed up to 是下一次即将做 checkpoint lsn 的位置,如果没有新数据写入则取 lsn 的值
  • last checkpoint at 是上一次检查点所在位置的 LSN。


当我们执行一条修改语句时,InnoDB 存储引擎的执行过程大概如下:

  1. 首先修改内存中的数据页,并在数据页中记录 LSN
  2. 在修改数据页的同时向 redo log in buffer 中写入 redo log,并记录下 LSN
  3. 写完 buffer 中的日志之后,当触发了日志刷盘的几种规则时,会向 redo log file on disk 刷入 redo 日志,并在该文件中记录下对应的 LSN
  4. 数据页不可能永远只停留在内存中,在某些情况下,会触发 checkpoint来 将内存中的脏页(数据脏页和日志脏页)刷到磁盘,所以会在本次 **checkpoint 脏页刷盘结束时,在 redo log 中记录 checkpoint 的 LSN 位置。**在 Checkpoint 完成之后,checkpoint LSN 之前的 Redo Log 就不再需要了
  5. 要刷入所有的数据页需要一定的时间来完成,中途刷入的每个数据页都会记下当前页所在的 LSN。


MySQL 在崩溃恢复时,会从重做日志 redo-log 的 Checkpoint 处开始执行重放操作。 它从 last Checkpoint 对应的 LSN 开始扫描 redo-log 日志,并将其应用到 buffer-pool 中,直到 last Checkpoint 对应的 LSN 等于 log flushed up to 对应的 LSN (也就是 redo-log 磁盘上存储的 LSN 值),则恢复完成 。


三、触发时机

Checkpoint 所做的事情无外乎是将缓冲池中的脏页刷回到磁盘,不同之处在于每次刷新多少页到磁盘,每次从哪里获取脏页,以及什么时间触发 Checkpoint。在 InnoDB 内部有两种 Checkpoint,分别为:


  • Sharp Checkpoint
  • Fuzzy Checkpoint


Sharp Checkpoint 发送在数据库关闭时将所有的脏页都刷新回磁盘,这是默认的工作方式,即参数 innodb_fast_shutdown=1。


但是若数据库在运行时也使用 Sharp Checkpoint,那么数据库的可用性就会受到很大影响。所以 InnoDB 存储引擎内部使用 Fuzzy Checkpoint 进行页的刷新,即每次只刷新一部分脏页。


InnoDB 存储引擎中可能发生时会触发 Fuzzy Checkpoint:


  • Master Thread Checkpoint:Master Thread 差不多以每秒或每十秒的速度从缓冲池的脏页列表中刷新一定比例的页回磁盘,这个过程是异步的,不会阻塞其他操作。
  • FLUSH_LRU_LIST Checkpoint:Buffer Pool 的 LRU 列表需要保留一定数量的空闲页面,来保证 Buffer Pool 中有足够的空间应对新的数据库请求。在空闲列表不足时,移除LRU列表尾端的页,若移除的页为脏页,则需要进行 Checkpoint。空闲数量阈值是可以配置的(默认是1024),这个检查在一个单独的 Page Cleaner 线程中进行。
  • Async/Sync Flush Checkpoint:当重做日志不可用(即 redo log 写满)时,需要强制将一些页刷新回磁盘,此时脏页从脏页列表中获取。


  1. 定义 checkpoint_age = redo_log_in_buffer_lsn - checkpoint_lsn,即有多少脏页还未刷回磁盘
  2. 定义 async_water_mark = 0.75 * total_redo_log_file_size,sync_water_mark = 0.9 * total_redo_log_file_size
  3. 如果 checkpoint_age < async_water_mark,那么不需要刷新任何脏页回磁盘
  4. 如果 async_water_mark < checkpoint_age < sync_water_mark,那么触发 Async Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark
  5. 如果 checkpoint_age > sync_water(种情况一般很少见,除非设置的重做日志文件太小),那么触发 Sync Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark
  6. 旧版本中 Async Flush 会阻塞发现问题的用户查询线程,Sync Flush 会阻塞所有查询线程,新版本中在独立的 Page Cleaner Thread 中执行,不会阻塞
  • Dirty Page too much Checkpoint:当脏页数量太多时会强制推进 Checkpoint,以保证缓冲区有足够的空闲页。innodb_max_dirty_pages_pct 的默认值为75,表示当缓冲池脏页比例达到该值时,就会强制进行 Checkpoint,刷新一部分脏页到磁盘。


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
存储 网络协议 关系型数据库
MySQL8.4创建keyring给InnoDB表进行静态数据加密
MySQL8.4创建keyring给InnoDB表进行静态数据加密
520 1
|
9月前
|
存储 关系型数据库 MySQL
介绍MySQL的InnoDB引擎特性
总结而言 , Inno DB 引搞 是 MySQL 中 高 性 能 , 高 可靠 的 存 储选项 , 宽泛 应用于要求强 复杂交易处理场景 。
386 15
|
SQL 缓存 关系型数据库
使用温InnoDB缓冲池启动MySQL测试
使用温InnoDB缓冲池启动MySQL测试
259 0
|
9月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
558 158
|
9月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
9月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
1458 152
|
9月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎,提供高性价比、稳定安全的云数据库服务,适用于多种行业与业务场景。
1067 156
|
9月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(中)
使用MYSQL Report分析数据库性能
607 156
|
9月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(上)
最终建议:当前系统是完美的读密集型负载模型,优化重点应放在减少行读取量和提高数据定位效率。通过索引优化、分区策略和内存缓存,预期可降低30%的CPU负载,同时保持100%的缓冲池命中率。建议每百万次查询后刷新统计信息以持续优化
713 161
|
10月前
|
存储 运维 关系型数据库
从MySQL到云数据库,数据库迁移真的有必要吗?
本文探讨了企业在业务增长背景下,是否应从 MySQL 迁移至云数据库的决策问题。分析了 MySQL 的优势与瓶颈,对比了云数据库在存储计算分离、自动化运维、多负载支持等方面的优势,并提出判断迁移必要性的五个关键问题及实施路径,帮助企业理性决策并落地迁移方案。

推荐镜像

更多