一文带你了解MySQL之InnoDB统计数据是如何收集的

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 我们前边唠叨查询成本的时候经常用到一些统计数据,比如通过show table status可以看到关于表的统计数据,通过show index可以看到关于索引的统计数据,那么这些统计数据是怎么来的呢?它们是以什么方式收集的呢?本章将聚焦于InnoDB存储引擎的统计数据收集策略,看完本章后家就会明白为啥前边老说InnoDB的统计信息是不精确的估计值了

一、两种不同的统计数据存储方式

InnoDB提供了两种存储统计数据的方式:


永久性的统计数据:这种统计数据存储在磁盘上,也就是服务器重启之后这些统计数据还在


非永久性的统计数据:这种统计数据存储在内存中,当服务器关闭时这些这些统计数据就都被清除掉了,等到服务器重启之后,在某些适当的场景下才会重新收集这些统计数据


MySQL给我们提供了系统变量innodb_stats_persistent来控制到底采用哪种方式去存储统计数据。在MySQL 5.6.6之前,innodb_stats_persistent的值默认是OFF,也就是说InnoDB的统计数据默认是存储到内存的,之后的版本中innodb_stats_persistent的值默认是ON,也就是统计数据默认被存储到磁盘中。


不过InnoDB默认是以表为单位来收集和存储统计数据的,也就是说我们可以把某些表的统计数据(以及该表的索引统计数据)存储在磁盘上,把另一些表的统计数据存储在内存中。怎么做到的呢?我们可以在创建和修改表的时候通过指定stats_persistent属性来指明该表的统计数据存储方式:

create table 表名 (...) engine=innodb, stats_persistent = (1|0);

alter table 表名 engine=innodb, stats_persistent = (1|0);

当stats_persistent=1时,表明我们想把该表的统计数据永久的存储到磁盘上

当stats_persistent=0时,表明我们想把该表的统计数据临时的存储到内存中

需要注意的是如果我们在创建表时未指定stats_persistent属性,那默认采用系统变量innodb_stats_persistent的值作为该属性的值

mysql> show variables like 'innodb_stats_persistent';

+-------------------------+-------+

| Variable_name           | Value |

+-------------------------+-------+

| innodb_stats_persistent | ON    |

+-------------------------+-------+

1 row in set (0.01 sec)

mysql> set persist innodb_stats_persistent =1;

Query OK, 0 rows affected (0.01 sec)


二、基于磁盘的永久性统计数据

当我们选择把某个表以及该表索引的统计数据存放到磁盘上时,实际上是把这些统计数据存储到了两个表里:

mysql> show tables from mysql like 'innodb%';

+---------------------------+

| Tables_in_mysql (innodb%) |

+---------------------------+

| innodb_index_stats        |

| innodb_table_stats        |

+---------------------------+

2 rows in set (0.03 sec)

可以看到,这两个表都位于mysql系统数据库下边,其中:


innodb_table_stats存储了关于表的统计数据,每一条记录对应着一个表的统计数据


innodb_index_stats存储了关于索引的统计数据,每一条记录对应着一个索引的一个统计项的统计数据


我们下边的就是看⼀下这两个表里边都有什么以及表里的数据是如何生成的


2.1 innodb_table_stats

这里直接看一下innodb_table_stats表中的各个列都是干嘛的:

字段名

描述

database_name

数据库名

table_name

表名

last_update

本条记录最后更新时间

n_rows

表中记录的条数

clustered_index_size

表的聚簇索引占用的页面数量

sum_of_other_index_sizes

表的其他索引占用的页面数量

注意这个表的主键是(database_name,table_name),也就是innodb_table_stats表的每条记录代表着一个表的统计信息。我们直接看一下这个表里的内容:

mysql> select * from mysql.innodb_table_stats where database_name= 'testdb' limit 2;

+---------------+---------------+---------------------+--------+----------------------+--------------------------+

| database_name | table_name    | last_update         | n_rows | clustered_index_size | sum_of_other_index_sizes |

+---------------+---------------+---------------------+--------+----------------------+--------------------------+

| testdb        | demo1         | 2023-05-06 18:20:56 |      1 |                    1 |                        0 |

| testdb        | demo8         | 2023-05-16 16:38:16 |  18758 |                   97 |                      170 |

+---------------+---------------+---------------------+--------+----------------------+--------------------------+

2 rows in set (0.01 sec)

可以看到我们熟悉的demo8表的统计信息就对应着mysql.innodb_table_stats的第二条记录。几个重要统计信息项的值如下:

n_rows的值是18758,表明demo8表中大约有18758条记录,注意这个数据是估计值

clustered_index_size的值是97,表明demo8表的聚簇索引占用97个页面,这个值是也是一个估计值

sum_of_other_index_sizes的值是170,表明demo8表的其他索引一共占用170个页面,这个值是也是一个估计值

2.1.1 n_rows 统计项的收集

为啥一直强调n_rows这个统计项的值是估计值呢?现在就来揭晓答案。InnoDB统计一个表中有多少条记录是这样的:


按照一定算法(并不是纯粹随机的)选取每个叶自节点页面,计算每个页面中主键值记录数量,然后计算平均一个页面中主键值的记录数量乘以全部叶自节点的数量就算是该表的n_rows值


小提示:

真实的计算过程比这个稍微复杂一些,不过大致上就是这样的意思


可以看出来这个n_rows值精确与否取决于统计时采样的页面数量,MySQL为我们准备了一个名为innodb_stats_persistent_sample_pages的系统变量来控制使用永久性的统计数据时,计算统计数据时采样的页面数量。


该值设置的越大,统计出的n_rows值越精确,但是统计耗时也就最久

该值设置的越小,统计出的n_rows值越不精确,但是统计耗时特别少。

所以在实际使用是需要我们去权衡利弊,该系统变量的默认值是20。

mysql> show variables like 'innodb_stats_persistent_sample_pages';

+--------------------------------------+-------+

| Variable_name                        | Value |

+--------------------------------------+-------+

| innodb_stats_persistent_sample_pages | 20    |

+--------------------------------------+-------+

1 row in set (0.01 sec)

mysql> set persist innodb_stats_persistent_sample_pages =20;

Query OK, 0 rows affected (0.02 sec)

我们前边说过,不过InnoDB默认是以表为单位来收集和存储统计数据的,我们也可以单独设置某个表的采样页面的数量,设置方式就是在创建或修改表的时候通过指定stats_sample_pages 属性来指明该表的统计数据存储方式:

create table 表名 (...) engine=innodb, stats_sample_pages = 具体的采样页面数量;

alter table 表名 engine=innodb, stats_sample_pages = 具体的采样页面数量;

如果我们在创建表的语句中并没有指定stats_sample_pages属性的话,将默认使用系统变量innodb_stats_persistent_sample_pages的值作为该属性的值。


2.1.2 clustered_index_size 和 sum_of_other_index_sizes统计项的收集

统计这两个数据需要大量用到我们之前学习的InnoDB表空间的知识,如果大家压根就没有看那一章,那下边的计算过程大家还是不要看了(看也看不懂);如果看过了,那大家就会发现InnoDB表空间的知识真是有用。


这两个统计项的收集过程如下:


步骤一: 从数据字典中找到表的各个索引对应的根页面位置(系统表sys_indexes里存储了各个索引对应的根页面信息)


步骤二: 从根页面的Page Header里找到叶子节点段和非叶子节点段对应的Segment Header。在每个索引的根⻚⾯的Page Header部分都有两个字段:


Page_btr_seg_leaf:表示B+树叶⼦段的Segment Header信息

Page_btr_seg_top:表示B+树⾮叶⼦段的Segment Header信息

步骤三: 从叶子节点段和非叶子节点段的Segment Header中找到这两个段对应的INODE Entry结构。


Segment Header结构如下:微信图片_20230525161539.png



从对应的INODE Entry结构中可以找到该段对应所有零散的页面地址以及free、not_full、full链表的基节点。


INODE Entry结构如下:

微信图片_20230525161639.png


直接统计零散的页面有多少个,然后从那三个链表的List Length字段中读出该段占用的区的大小,每个区占用64个页,所以就可以统计出整个段占用的页面。


这个是链表基节点的示意图:


微信图片_20230525161714.png

步骤四: 分别计算聚簇索引的叶子结点段和非叶子节点段占用的页面数,它们的和就是clustered_index_size的值,按照同样的套路把其余索引占用的页面数都算出来,加起来之后就是sum_of_other_index_sizes的值


这里需要大家注意一个问题,我们说一个段的数据在非常多时(超过32个页面),会以区为单位来申请空间,这里的问题是以区为单位申请空间中有一些页可能并没有使用,但是在统计clustered_index_size和sum_of_other_index_sizes时都把它们算进去了,所以说聚簇索引和其他的索引占用的页面数可能比这两个值要大一些。


2.2 innodb_index_stats

直接看一下这个innodb_index_stats表中的各个列都是干嘛的:

字段名

描述

database_name

数据库名

table_name

表名

index_name

索引名

last_update

本条记录最后更新时间

stat_name

统计项的名称

stat_value

对应的统计项的值

sample_size

为生成统计数据而采样的页面数量

stat_description

对应的统计项的描述

注意这个表的主键是(database_name,table_name,index_name,stat_name),其中的stat_name是指统计项的名称,也就是说innodb_index_stats表的每条记录代表着一个索引的一个统计项。可能这会大家有些懵逼这个统计项到底指什么,别着急,我们直接看一下关于demo8表的索引统计数据都有些什么:

mysql> select * from mysql.innodb_index_stats where table_name='demo8';

+---------------+------------+--------------+---------------------+--------------+------------+-------------+-----------------------------------+

| database_name | table_name | index_name   | last_update         | stat_name    | stat_value | sample_size | stat_description                  |

+---------------+------------+--------------+---------------------+--------------+------------+-------------+-----------------------------------+

| testdb        | demo8      | PRIMARY      | 2023-05-16 16:38:16 | n_diff_pfx01 |      18750 |          20 | id                                |

| testdb        | demo8      | PRIMARY      | 2023-05-16 16:38:16 | n_leaf_pages |         75 |        NULL | Number of leaf pages in the index |

| testdb        | demo8      | PRIMARY      | 2023-05-16 16:38:16 | size         |         97 |        NULL | Number of pages in the index      |

| testdb        | demo8      | idx_key1     | 2023-05-16 16:38:16 | n_diff_pfx01 |        256 |          22 | key1                              |

| testdb        | demo8      | idx_key1     | 2023-05-16 16:38:16 | n_diff_pfx02 |      18567 |          22 | key1,id                           |

| testdb        | demo8      | idx_key1     | 2023-05-16 16:38:16 | n_leaf_pages |         22 |        NULL | Number of leaf pages in the index |

| testdb        | demo8      | idx_key1     | 2023-05-16 16:38:16 | size         |         23 |        NULL | Number of pages in the index      |

| testdb        | demo8      | idx_key2     | 2023-05-16 16:38:16 | n_diff_pfx01 |      18565 |          18 | key2                              |

| testdb        | demo8      | idx_key2     | 2023-05-16 16:38:16 | n_leaf_pages |         18 |        NULL | Number of leaf pages in the index |

| testdb        | demo8      | idx_key2     | 2023-05-16 16:38:16 | size         |         19 |        NULL | Number of pages in the index      |

| testdb        | demo8      | idx_key3     | 2023-05-16 16:38:16 | n_diff_pfx01 |       4053 |          30 | key3                              |

| testdb        | demo8      | idx_key3     | 2023-05-16 16:38:16 | n_diff_pfx02 |      18568 |          30 | key3,id                           |

| testdb        | demo8      | idx_key3     | 2023-05-16 16:38:16 | n_leaf_pages |         30 |        NULL | Number of leaf pages in the index |

| testdb        | demo8      | idx_key3     | 2023-05-16 16:38:16 | size         |         31 |        NULL | Number of pages in the index      |

| testdb        | demo8      | idx_key_part | 2023-05-16 16:38:16 | n_diff_pfx01 |      16122 |          50 | key_part1                         |

| testdb        | demo8      | idx_key_part | 2023-05-16 16:38:16 | n_diff_pfx02 |      18570 |          50 | key_part1,key_part2               |

| testdb        | demo8      | idx_key_part | 2023-05-16 16:38:16 | n_diff_pfx03 |      18570 |          50 | key_part1,key_part2,key_part3     |

| testdb        | demo8      | idx_key_part | 2023-05-16 16:38:16 | n_diff_pfx04 |      18570 |          50 | key_part1,key_part2,key_part3,id  |

| testdb        | demo8      | idx_key_part | 2023-05-16 16:38:16 | n_leaf_pages |         50 |        NULL | Number of leaf pages in the index |

| testdb        | demo8      | idx_key_part | 2023-05-16 16:38:16 | size         |         97 |        NULL | Number of pages in the index      |

+---------------+------------+--------------+---------------------+--------------+------------+-------------+-----------------------------------+

20 rows in set (0.03 sec)

这个结果有点多,正确查看这个结果的方式是这样的:


先查看index_name列,这个列说明该记录是哪个索引的统计信息,从结果中我们可以看出来,PRIMARY索引(也就是主键)占了3条记录,idx_key_part索引占了6条记录。


针对index_name列相同的记录,stat_name表示针对该索引的统计项名称,stat_value展示的是该索引在该统计项上的值,stat_description指的是来描述该统计项的含义的。我们来具体看一下一个索引都有哪些统计项:


n_leaf_pages:表示该索引的叶子节点占用多少页面


size:表示该索引共占用多少页面


n_diff_pfxNN:表示对应的索引列不重复的值有多少。其中的NN长得有点⼉怪呀,啥意思呢? 其实NN可以被替换为01、02、03… 这样的数字。比如对于idx_key_part来说:


n_diff_pfx01表示的是统计key_part1这单单一个列不重复的值有多少

n_diff_pfx02表示的是统计key_part1、key_part2这两个列组合起来不重复的值有多少

n_diff_pfx03表示的是统计key_part1、key_part2、key_part3这三个列组合起来不重复的值有多少

n_diff_pfx04表示的是统计key_part1、key_part2、key_part3、id这四个列组合起来不重复的值有多少

小提示:

这里需要注意的是,对于普通的二级索引,并不能保证它的索引列值是唯一的,比如对于idx_key1来说,key1列就可能有很多值重复的记录。此时只有在索引列上加上主键值才可以区分两条索引列值都一样的二级索引记录。对于主键和唯一二级索引则没有这个问题,它们本身就可以保证索引列值的不重复,所以也不需要再统计一遍在索引列后加上主键值的不重复值有多少。比如上边的idx_key1有n_diff_pfx01、n_diff_pfx02两个统计项,而idx_key2却只有n_diff_pfx01一个统计项。


在计算某些索引列中包含多少不重复值时,需要对这些叶子节点页面进行采样,size列就表明了采样的页面数量是多少

小提示:

对于有多个列的联合索引来说,采样的页面数量是:innodb_stats_persistent_sample_pages × 索引列的个数。当需要采样的页面数量大于该索引的叶子节点数量的话,就直接采用全表扫描来统计索引列的不重复值数量了。所以大家可以在查询结果中看到不同索引对应的size列的值可能是不同的。


2.3 定期更新统计数据

随着我们不断的对表进行增删改操作,表中的数据也一直在变化,innodb_table_stats和innodb_index_stats表立的统计数据是不是也应该跟着变一变了?当然要变了,不变的话MySQL查询优化器计算的成本可就差老远了。MySQL的提供了如下两种更新统计数据的方式:


开启innodb_stats_auto_recalc


系统变量innodb_stats_auto_recalc决定着服务器是自动重新计算统计数据,它的默认值是ON,也就是该功能默认是开启的。每个表都维护了一个变量,该变量记录着对该表进行增删改的记录条数,如果发生变动的记录数量超过了表大小的10%,并且自动重新计算统计数据的功能是打开的,那么服务器会重新进行一次统计数据的计算,并且更新innodb_table_stats和innodb_index_stats表。不过自动重新计算统计数据的过程是异步发生的,也就是即使表中变动的记录数超过了10%,自动重新计算统计数据也不会立即发生,可能会延迟几秒才会进行计算。

mysql> show variables like 'innodb_stats_auto_recalc';

+--------------------------+-------+

| Variable_name            | Value |

+--------------------------+-------+

| innodb_stats_auto_recalc | ON    |

+--------------------------+-------+

1 row in set (0.00 sec)

mysql> set persist innodb_stats_auto_recalc =1;

Query OK, 0 rows affected (0.00 sec)

再一次强调,InnoDB默认是以表为单位来收集和存储统计数据的,我们也可以单独为某个表设置是否自动重新计算统计数的属性,设置方式就是在创建或修改表的时候通过指定stats_auto_recalc属性来指明该表的统计数据存储方式:

create table 表名 (...) engine=innodb, stats_auto_recalc = (1|0);

alter table 表名 engine=innodb, stats_auto_recalc = (1|0);

当stats_auto_recalc=1时,表明我们想让该表自动重新计算统计数据当stats_persistent=0时,表明不想让该表自动重新计算统计数据


如果我们在创建表时未指定stats_auto_recalc属性,那默认采用系统变量innodb_stats_auto_recalc的值作为该属性的值。


手动调用analyze table语句来更新统计信息


如果innodb_stats_auto_recalc系统变量的值为OFF的话,我们也可以手动调用analyze table语句来重新计算统计数据,比如我们可以这样更新关于demo8表的统计数据:


mysql> analyze table demo8;


需要注意的是,analyze table语句会立即重新计算统计数据,也就是这个过程是同步的,在表中索引多或者采样页面特别多时这个过程可能会特别慢,请不要没事就运行一下analyze table语句,最好在业务不是很繁忙的时候再运行。


2.4 手动动更新innodb_table_stats 和 innodb_index_stats表

其实innodb_table_stats和innodb_index_stats表就相当于一个普通的表一样,我们能对它们做增删改查操作。这也就意味着我们可以手动更新某个表或者索引的统计数据。比如说我们想把demo8表关于行数的统计数据更改一下可以这么做:


步骤一: 更新demo8表


update innodb_table_stats set n_rows = 1 where table_name = 'demo8';


步骤二: 让MySQL查询优化器重新加载我们更改过的数据


更新完innodb_table_stats只是单纯的修改了一个表的数据,需要让MySQL查询优化器重新加载我们更改过的数据,运行下边的命令就可以了:


flush table demo8;


之后我们使用show table status语句查看表的统计数据时就看到Rows行变为了1。


三、基于内存的非永久性统计数据

当我们把系统变量innodb_stats_persistent的值设置为OFF时,之后创建的表的统计数据默认就都是非永久性的了,或者我们直接在创建表或修改表时设置stats_persistent属性的值为0,那么该表的统计数据就是非永久性的了。


与永久性的统计数据不同,非永久性的统计数据采样的页面数量是由innodb_stats_transient_sample_pages控制的,这个系统变量的默认值是8。另外,由于非永久性的统计数据经常更新,所以导致MySQL查询优化器计算查询成本的时候依赖的是经常变化的统计数据,也就会生成经常变化的执行计划,这个可能让大家有些懵逼。不过最近的MySQL版本都不咋用这种基于内存的非永久性统计数据了,所以我们也就不深入了解了。

mysql> show variables like 'innodb_stats_transient_sample_pages';

+-------------------------------------+-------+

| Variable_name                       | Value |

+-------------------------------------+-------+

| innodb_stats_transient_sample_pages | 8     |

+-------------------------------------+-------+

1 row in set (0.01 sec)

mysql> set persist innodb_stats_transient_sample_pages =1;

Query OK, 0 rows affected (0.00 sec)


四、innodb_stats_method 的使用

我们知道索引列不重复的值的数量这个统计数据对于MySQL查询优化器十分重要,因为通过它可以计算出在索引列中平均一个值重复多少行,它的应用场景主要有两个:


单表查询中单点区间太多,比如说这样: 当IN里的参数数量过多时,采用index dive的方式直接访问B+树索引去统计每个单点区间对应的记录的数量就太耗费性能了,所以直接依赖统计数据中的平均一个值重复多少行来计算单点区间对应的记录数量。

select * from tbl_name where key in ('xx1', 'xx2', ..., 'xxn');

连接查询时,如果有涉及两个表的等值匹配连接条件,该连接条件对应的被驱动表中的列又拥有索引时,则可以使用ref访问方法来对被驱动表进行查询,比如说这样:


select * from t1 join t2 on t1.column = t2.key where ...;


在真正执行对t2表的查询前,t1.comumn的值是不确定的,所以我们也不能通过index dive的方式直接访问B+树索引去统计每个单点区间对应的记录的数量,所以也只能依赖统计数据中的平均一个值重复多少次来计算单点区间对应的记录数量。


在统计索引列不重复的值的数量时,有一个比较烦的问题就是索引列中出现NULL值怎么办,比如说某个索引列的内容是这样:

+------+

| col  |

+------+

|    1 |

|    2 |

| NULL |

| NULL |

+------+

mysql> select 1 != null;

+-----------+

| 1 != null |

+-----------+

|      null |

+-----------+

1 row inset (0.00 sec)

mysql> select null = null;

+-------------+

| null = null |

+-------------+

|        null |

+-------------+

1 row inset (0.00 sec)

mysql> select null != null;

+--------------+

| null != null |

+--------------+

|         null |

+--------------+

1 row inset (0.00 sec)


所以每一个NULL值都是独一无二的,也就是说统计索引列不重复的值的数量时,应该把NULL值当作一个独立的值,所以col列的不重复的值的数量就是:4(分别是1、2、NULL、NULL这四个值)。


有的人认为其实NULL值在业务上就是代表没有,所有的NULL值代表的意义是一样的,所以col列不重复的值的数量就是:3(分别是1、2、NULL这三个值)。


有的人认为这NULL完全没有意义嘛,所以在统计索引列不重复的值的数量时压根不能把它们算进来,所以col列不重复的值的数量就是:2(分别是1、2这两个值)。


MySQL提供了一个名为innodb_stats_method的系统变量,相当于在计算某个索引列不重复值的数量时如何对待NULL值这个锅甩给了用户,这个系统变量有三个候选值:


nulls_equal:认为所有NULL值都是相等的。这个值也是innodb_stats_method的默认值。


如果某个索引列中NULL值特别多的话,这种统计⽅式会让优化器认为某个列中平均一个值重复次数特别多,所以倾向于不使用索引进行访问。


nulls_unequal:认为所有NULL值都是不相等的。


如果某个索引列中NULL值特别多的话,这种统计⽅式会让优化器认为某个列中平均一个值重复次数特别少,所以倾向于使用索引进行访问。


nulls_ignored:直接把NULL值忽略掉。


反正这个锅是甩给用户了,当你选定了innodb_stats_method值之后,优化器即使选择了不是最优的执行计划,那也跟MySQL没关系了哈~ 当然对于用户的我们来说,最好不在索引列中存放NULL值才是正解。


总结

InnoDB以表为单位来收集统计数据,这些统计数据可以是基于磁盘的永久性统计数据,也可以是基于内存的非永久性统计数据。


innodb_stats_persistent控制着使用永久性统计数据还是非永久性统计数据;


innodb_stats_persistent_sample_pages控制着永久性统计数据的采样

页面数量;


innodb_stats_transient_sample_pages控制着非永久性统计数据的采样页面数量;


innodb_stats_auto_recalc控制着是否自动重新计算统计数据。


我们可以针对某个具体的表,在创建和修改表时通过指定stats_persistent、stats_auto_recalc、stats_sample_pages的值来控制相关统计数据属

性。


innodb_stats_method决定着在统计某个索引列不重复值的数量时如何对待NULL值


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3天前
|
存储 关系型数据库 MySQL
MySQL存储引擎详述:InnoDB为何胜出?
MySQL 是最流行的开源关系型数据库之一,其存储引擎设计是其高效灵活的关键。InnoDB 作为默认存储引擎,支持事务、行级锁和外键约束,适用于高并发读写和数据完整性要求高的场景;而 MyISAM 不支持事务,适合读密集且对事务要求不高的应用。根据不同需求选择合适的存储引擎至关重要,官方推荐大多数场景使用 InnoDB。
36 7
|
9天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
38 6
|
12天前
|
存储 关系型数据库 MySQL
Mysql索引:深入理解InnoDb聚集索引与MyisAm非聚集索引
通过本文的介绍,希望您能深入理解InnoDB聚集索引与MyISAM非聚集索引的概念、结构和应用场景,从而在实际工作中灵活运用这些知识,优化数据库性能。
66 7
|
1月前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
本文介绍了MySQL InnoDB存储引擎中的数据文件和重做日志文件。数据文件包括`.ibd`和`ibdata`文件,用于存放InnoDB数据和索引。重做日志文件(redo log)确保数据的可靠性和事务的持久性,其大小和路径可由相关参数配置。文章还提供了视频讲解和示例代码。
142 11
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
|
19天前
|
存储 关系型数据库 MySQL
MySQL引擎InnoDB和MyISAM的区别?
InnoDB是MySQL默认的事务型存储引擎,支持事务、行级锁、MVCC、在线热备份等特性,主索引为聚簇索引,适用于高并发、高可靠性的场景。MyISAM设计简单,支持压缩表、空间索引,但不支持事务和行级锁,适合读多写少、不要求事务的场景。
50 9
|
21天前
|
SQL 关系型数据库 MySQL
mysql分页读取数据重复问题
在服务端开发中,与MySQL数据库进行数据交互时,常因数据量大、网络延迟等因素需分页读取数据。文章介绍了使用`limit`和`offset`参数实现分页的方法,并针对分页过程中可能出现的数据重复问题进行了详细分析,提出了利用时间戳或确保排序规则绝对性等解决方案。
|
26天前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
1月前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
在项目中,为了解决Redis与Mysql的数据一致性问题,我们采用了多种策略:对于低一致性要求的数据,不做特别处理;时效性数据通过设置缓存过期时间来减少不一致风险;高一致性但时效性要求不高的数据,利用MQ异步同步确保最终一致性;而对一致性和时效性都有高要求的数据,则采用分布式事务(如Seata TCC模式)来保障。
64 14
|
1月前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的表空间
InnoDB是MySQL默认的存储引擎,主要由存储结构、内存结构和线程结构组成。其存储结构分为逻辑和物理两部分,逻辑存储结构包括表空间、段、区和页。表空间是InnoDB逻辑结构的最高层,所有数据都存放在其中。默认情况下,InnoDB有一个共享表空间ibdata1,用于存放撤销信息、系统事务信息等。启用参数`innodb_file_per_table`后,每张表的数据可以单独存放在一个表空间内,但撤销信息等仍存放在共享表空间中。
|
1月前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的段、区和页
MySQL的InnoDB存储引擎逻辑存储结构与Oracle相似,包括表空间、段、区和页。表空间由段和页组成,段包括数据段、索引段等。区是1MB的连续空间,页是16KB的最小物理存储单位。InnoDB是面向行的存储引擎,每个页最多可存放7992行记录。