一看就懂的：MySQL数据页以及页分裂机制-阿里云开发者社区

一看就懂的：MySQL数据页以及页分裂机制

2022-05-14 2266

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 回顾一下之前和大家分享的知识点看了前面的文章，想必你肯定了解了什么是Buffer Pool、LRU-List、Free-List、Flush-List，你也知道了当MySQL增删改查时，内存中发生了什么，以及这几个双向链表是如何配合工作的。通过阅读上一篇文章你也一定了解了：你create出来的table其实是属于一个表空间的，而所谓的表空间其实对应着一个真实存在于物理磁盘上的文件。并且在前面的文章中，白日梦曾不止一次的提及到：InnoDB从磁盘中读取数据的最小单位是数据页。而你想得到的id = xxx的数据，就是这个数据页众多行中的一行。

一、知识回顾#

回顾一下之前和大家分享的知识点

看了前面的文章，想必你肯定了解了什么是Buffer Pool、LRU-List、Free-List、Flush-List，你也知道了当MySQL增删改查时，内存中发生了什么，以及这几个双向链表是如何配合工作的。

通过阅读上一篇文章你也一定了解了：你create出来的table其实是属于一个表空间的，而所谓的表空间其实对应着一个真实存在于物理磁盘上的文件。

并且在前面的文章中，白日梦曾不止一次的提及到：InnoDB从磁盘中读取数据的最小单位是数据页。而你想得到的id = xxx的数据，就是这个数据页众多行中的一行。

下面我们就一起看下，究竟什么是MySQL的数据页、数据区等概念。

二、数据页长啥样？#

数据页长下面这样：

三、什么是数据区？#

在MySQL的设定中，同一个表空间内的一组连续的数据页为一个extent（区），默认区的大小为1MB，页的大小为16KB。16*64=1024，也就是说一个区里面会有64个连续的数据页。连续的256个数据区为一组数据区。

于是我们可以画出这张图：

从直观上看，其实不用纳闷为啥MySQL按照这样的方式组织存储在磁盘上的数据。

这就好比你搞了个Java的封装类描述一类东西，然后再相应的给它加上一些功能方法，或者用golang封装struct去描述一类对象。最终的目的都是为了方便、管理、控制。

约定好了数据的组织方式，那MySQL的作用不就是：按照约定数据规则将数据文件中的数据加载进内存，然后展示给用户看，以及提供其他能力吗？

四、数据页分裂问题#

假设你现在已经有两个数据页了。并且你正在往第二个数据页中写数据。

关于B+Tree，你肯定知道B+Tree中的叶子结点之间是通过双向链表关联起来的。

在InnoDB索引的设定中，要求主键索引是递增的，这样在构建索引树的时候才更加方便。你可以脑补一下。如果按1、2、3...递增的顺序给你这些数。是不是很方便的构建一棵树。然后你可以自由自在的在这棵树上玩二分查找。

那假设你自定义了主键索引，而且你自定义的这个主键索引并不一定是自增的。

那就有可能出现下面这种情况如下图：

假设上图中的id就是你自定义的不会自增的主键

然后随着你将数据写入。就导致后一个数据页中的所有行并不一定比前一个数据页中的行的id大。

这时就会触发页分裂的逻辑。

页分裂的目的就是保证：后一个数据页中的所有行主键值比前一个数据页中主键值大。

经过分裂调整，可以得到下面的这张图。

参考：

https://dev.mysql.com/doc/refman/5.7/en/glossary.html

一看就懂的：MySQL数据页以及页分裂机制

一、知识回顾#

二、数据页长啥样？#

三、什么是数据区？#

四、数据页分裂问题#

推荐阅读#

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

一看就懂的：MySQL数据页以及页分裂机制

一、知识回顾#

二、数据页长啥样？#

三、什么是数据区？#

四、数据页分裂问题#

推荐阅读#

热门文章

最新文章

相关课程

相关电子书

推荐镜像