MySQL中的分析表、检查表与优化表如何操作?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL中的分析表、检查表与优化表如何操作?

MySQL提供了分析表、检查表和优化表的语句。分析表主要是分析关键字的分布,检查表主要是检查表是否存在错误,优化表主要是消除删除或者更新造成的空间浪费。

【1】分析表

MySQL中提供了 ANALYZE TABLE 语句分析表,analyze table 语句的基本语法如下:

analyze [local | no_write_to_binlog] table table_name[,tbl_name]....


默认的,MySQL服务会将analyze table语句写到binlog中,以便在主从架构中,从服务能够同步数据。可以添加参数 local 或者 no_write_to_binlog 取消将语句写到binlog中。


使用 analyze table 分析表的过程中,数据库系统会自动对表加一个 只读锁。 在分析期间,只能读取表中的记录,不能更新和插入记录。analyze table 语句能够分析 InnoDB和MyISAM类型的表,但是不能作用于视图。


analyze table分析后的统计结果会反映到 cardinality 的值,该值统计了表中某一键所在的列不重复的值的个数。 该值越接近表中的总行数,则在表连接查询或者索引查询时,就越优先被优化器选择使用。也就是索引列的 cardinality 的值与表中数据的总条数差距越大,即使查询的时候使用了该索引作为查询条件,存储引擎实际查询的时候使用的概率就越小。


下面通过例子来验证一下,cardinality 可以通过 show index from table_name 查看。

CREATE TABLE `user1` (
  `id` int NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  `age` int DEFAULT NULL,
  `sex` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1001 DEFAULT CHARSET=utf8mb3;


创建表user1,并插入1000条数据,其中name值均为jane 。此时我们执行 SHOW INDEX FROM user1;

2f0f10f8fc504803b6151fe34fdc33ec.png


如上图所示,Cardinality 列 对于id 是12(其实应该是1000),对于name是1(实际就是1)。我们使用分析表语句 后再次查看:

4728616eae9547ff8164a1c8a62f3a11.png上面结果显示的信息说明如下:


Table:表示分析的表的名称

Op:表示执行的操作。analyze表示进行分析操作

Msg_type:表示信息类型,其值通常是状态(status)、信息(info)、注意(note)、警告(warning)和错误(error)之一。

Msg_text:显示信息。


此时再次查看user表的 Cardinality,如下所示:

SHOW INDEX FROM user1;

可以看到id主键的Cardinality已经修正,和数据总量一致,此时索引已经修复,查询效率大大提高。这个值只要大致相同就表示索引被优化器使用的概率就越大。



我们修改id=2的name值,然后再次分析查看,可以看到Cardinality列已经从 1 变成了 2:

# 修改值
update user1 set name='janus' where id=2;
# 查看索引
SHOW INDEX FROM user1;
# 分析表
analyze table user1;
# 查看索引
SHOW INDEX FROM user1;

我们查看下面SQL的执行计划:

explain select * from user1 where name='jane'

结果如下所示,可以看到虽然name字段上面有索引,但是执行计划中显示type为’ALL’,表示并没有使用到索引。

我们再看下面SQL的执行计划:

explain select * from user1 where name='janus'

结果如下所示,可以看到确实是用到了索引,检索的行数rows为1。

这两个SQL也说明了:

  • 如果取值离散度太小,那么不太适合创建索引
  • 如果创建了索引,那么查询“索引取值少量数据”时才会用到索引

【2】检查表


MySQL中可以使用 CHECK TABLE语句来检查表。CHECK TABLE语句能够检查InnoDB和MyISAM类型的表是否存在错误。 CHECK TABLE语句在执行过程中也会给表加上只读锁。


对于MyISAM类型的表,CHECK TABLE 语句还会更新关键字统计数据。而且 CHECK TABLE也可以检查视图是否有错误,比如在视图定义中被引用的表已不存在。


该语句的基本语法如下:

CHECK TABLE table_name[, table_name] ....[option]...
option={QUICK | FAST | MEDIUM | EXTENDED |CHANGED }

option各个选项的意义分别是:


QUICK:不扫描行,不检查错误的连接

FAST:只检查没有被正确关闭的表

CHANGED:只检查上次检查后被更改的表和没有被正确关闭的表

MEDIUM:扫描行,以验证被删除的连接是有效的。也可以计算各行的关键字校验和,并使用计算出的校验和验证这一点。

EXTENDED:对每行的所有关键字进行一个全面的关键字查找。这可以确保表时100%一致的,但是花的时间较长。


option只对MyISAM类型的表有效,对InnoDB类型的表无效。比如:

check table user1

该语句对于检查的表可能会产生多行信息。最后一行有一个状态的Msg_type值 ,Msg_text通常为OK。如果得到的不是OK,通常要对其进行修复;是OK说明表已经是最新的了。表已经是最新的,意味着存储引擎对这张表不必进行检查。


【3】优化表

① OPTIMIZE TABLE


MySQL中使用optimize table语句来优化表。但是,optimize table语句只能优化表中的varchar、blob或text类型的字段。一个表使用了这些字段的数据类型,若已经删除了表的一大部分数据,或者已经对含有可变长度行的表(含有varchar、blob或text列的表)进行了很多更新,则应使用optimize table来重新利用未使用的空间,并整理数据文件的碎片。


optimize table语句对InnoDB和MyISAM类型的表都有效。该语句在执行过程中也会给表加上只读锁。optimize table语句的基本语法如下:

optimize [local | no_write_to_binlog] table table_name [,table_name]...

ocal | no_write_to_binlog 关键字的意义和分析表相同,都是指定不写入二进制日志。


如下所示,我们在user1中插入十万条数据,占用空间如下:

30692f17214f40a3b71697d62c980323.png


如下所示,我们删除一半数据,再次查看该文件,发现占用大小并未改变

delete from user1 where id>50000

1a185062dba14ba59acd02bc94a1c36e.png


优化表之后再次查看,发现文件占用空间变小:

optimize table user1;



上图(优化结果示意图)是正常的,针对MySQL的InnoDB引擎,optimize结果就是那样的(官网有说明)。在MyISAM中,是先分析这张表,然后会整理相关的MySQL datafile,之后回收未使用的空间。在InnoDB中,回收空间是简单通过alter table 进行整理空间。在优化期间,MySQL会创建一个临时表,优化完成之后会删除原始表,然后会将临时表rename成为原始表。


注意,在多数的设置中,根本不需要运行 optimize table。即使对可变长度的行进行了大量的更新,也不需要经常运行,每周一次或每月一次即可。并且只需要对特定的表运行。


② mysqlcheck

mysqlcheck -o DatabaseName tableName -uroot -p******


mysqlcheck是Linux中的rompt,-o是代表Optimize。


举例:优化所有表:


mysqlcheck -o DatabaseName -u root -p****
# 或
mysqlcheck -o --all-databases -u root -p****


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
7天前
|
SQL 运维 关系型数据库
MySQL 中 GRANT 操作会引起复制中断吗?
GRANT 操作并不是一个原子性操作,不管执行成功与否,都会触发一个隐式重载授权表的行为。 在生产环境中需要规范用户创建及授权的操作,不推荐使用 DML 语句去直接变更 mysql.user 表,可能会引发其他的问题,若使用了 DML 语句进行变更, 需要手工执行 flush privileges。
22 4
|
3天前
|
缓存 监控 关系型数据库
MySQL PXC 集群死锁分析案例
前不久一个系统死锁导致部分业务受到影响,今次补上详细的节点日志分析过程。
21 1
|
6天前
|
缓存 关系型数据库 MySQL
MySQL优化
【7月更文挑战第21天】MySQL优化
18 1
|
10天前
|
SQL 关系型数据库 MySQL
实时计算 Flink版操作报错合集之从mysql读数据写到hive报错,是什么原因
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
10天前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版操作报错合集之运行mysql to doris pipeline时报错,该如何排查
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
10天前
|
关系型数据库 MySQL 调度
MySQL高级功能与优化策略深度探索
MySQL高级功能与优化策略深度探索
|
10天前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版操作报错合集之整库同步mysql到starRock提交任务异常,该如何处理
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
19天前
|
SQL 关系型数据库 MySQL
「Python入门」python操作MySQL和SqlServer
**摘要:** 了解如何使用Python的pymysql模块与MySQL数据库交互。首先,通过`pip install pymysql`安装模块。pymysql提供与MySQL的连接功能,例如创建数据库连接、执行SQL查询。在设置好MySQL环境后,使用`pymysql.connect()`建立连接,并通过游标执行SQL(如用户登录验证)。注意防止SQL注入,使用参数化查询。增删改操作需调用`conn.commit()`来保存更改。pymssql模块类似,但导入和连接对象创建略有不同。
24 0
「Python入门」python操作MySQL和SqlServer
|
25天前
|
SQL 存储 关系型数据库
|
29天前
|
关系型数据库 MySQL 数据库
『Django』模型入门教程-操作MySQL
一个后台如果没有数据库可以说废了一半。日常开发中大多数时候都在与数据库打交道。Django 为我们提供了一种更简单的操作数据库的方式。 在 Django 中,模型(Model)是用来定义数据库结构的类。每个模型类通常对应数据库中的一个表,类的属性对应表中的列。通过定义模型,Django 的 ORM(Object-Relational Mapping)可以将 Python 对象映射到数据库表,并提供一套 API 来进行数据库操作。 本文介绍模型的用法。