Mysql内核查询成本计算

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: Mysql内核查询成本计算

sql语句查询成本的组成

  I/O成本:将数据从磁盘读到内存的成本。

  CPU成本 数据读到内存后过滤、排序得到满足条件数据的成本。

  总成本  =I/O成本+CPU成本

注意:对于InnoDB存储引擎来说,页是磁盘和内存之间交互的基本单位,MySQL规定读取一个页 面花费的成本默认是1.0,读取以及检测一条记录是否符合搜索条件的成本默认是0.2。 1.0、0.2这些数字称之为成本常数,这两个成本常数我们最常用到,当然还有其他的成本常数。

查看mysql执行所有可能途径使用的成本

  1. 开启trace工具来一查究竟,开启trace工具会影响mysql性能,所以只能临时分析sql使用,用完之后立即关闭,具体方法参考:Mysql索引优化实战一_季风泯灭的季节的博客-CSDN博客

2. 使用explain查看,在explain后面加上 format=json 即可。

explain format=json SELECT  * from test5

单表查询的成本

 计算成本的过程

1、根据搜索条件,找出所有可能使用的索引

2、计算全表扫描的代价

3、计算使用不同索引执行查询的代价

4、对比各种执行方案的代价,找出成本最低的那一个

 全表扫描的代价

    I/O成本=总页数*1.0+1.1

    CPU成本 =总记录数*0.2+1.0

   数据库表都维护了总记录数, InnoDB是一个估算的值,MYISAM是一个准确的值。通过SHOW TABLE STATUS 命令可以查到。总页数则用表的总大小➗16➗1024得到。

 二级索引的代价

    1. 使用二级索引的成本

         如果是范围查询则算一次IO,因为它属于顺序IO。如果是精准查询则有几个就是几次IO,因为它是随机IO.顺序IO的效率大概是随机IO的40-400倍。如 in(1,3)就是两次IO。二级索引的成本如下:

      I/O成本=待查找总页数(IO次数)*1.0

      CPU成本 =待回表总记录数*0.2+0.01

    2. 回表的代价

        mysql需先计算出要回表的记录数,如果总记录数小于10页,则精准计算,如果大于10页,则以前10页的平均记录数X页数(页数从父节点的关键字数统计得出)进行估算。

      I/O成本=待回表总记录数*1.0

      CPU成本 =总记录数*0.2

  使用二级索引时不用考虑回表的CPU成本。总成本等于上述三者之和。

通过上述比较我们可以联想到,当走索引需要回表的记录数接近或大于原表的总页数时,走索引回表造成的成本可能就比不走索引的成本要高,那么mysql优化器可能会选择全表扫描。

表关联查询的成本

MySQL中连接查询采用的是嵌套循环连接算法,驱动表会被访问一次,被 驱动表可能会被访问多次,所以对于两表连接查询来说,它的查询成本由下边两个部分 构成:

1. 单次查询驱动表的成本

2. 多次查询被驱动表的成本(具体查询多少次取决于对驱动表查询的结果集中有多少条

记录)

对驱动表进行查询后得到的记录条数称之为驱动表的 扇出 (英文名:fanout)。很显然 驱动表的扇出值越小,对被驱动表的查询次数也就越少,连接查询的总成本也就越低。 当查询优化器想计算整个连接查询所使用的成本时,就需要计算出驱动表的扇出值。

如果使用的是全表扫描的方式执行的单表查询,那么计算驱动表扇出时需要猜满足搜索条件的记录到底有多少条(不借助索引)。

如果使用的是索引执行的单表扫描,那么计算驱动表扇出的时候需要猜满足除使用到 对应索引的搜索条件外的其他搜索条件的记录有多少条(借助索引先过滤)。

MySQL把这个猜的过程称之为 condition filtering 。当然,这个过程可能会使用到索 引,也可能使用到统计数据,也可能就是MySQL单纯的瞎猜。

两表连接的成本分析

连接查询的成本计算公式是这样的:

连接查询总成本 = 单次访问驱动表的成本 + 驱动表扇出数 x 单次访问被驱动表的成本

可以知道,要想优化表关联查询有两个方向:

  1.  尽量减少驱动表的扇出,即以小表做驱动表。

  2. 减少被驱动表的单次访问成本(因为扇出数存在,使得单次访问被驱动表),即尽可能的避免磁盘IO,去走索引,且让回表的记录数尽可能的少。

多表连接的成本

   多表连接的成本与两表连接类似,只是后一个表以前面的sql查询结果为扇出去查询,其查询性能消耗为 x+ny+nz....,x、y、z为各表查询成本,n为扇出数。同时,mysql在sql分析阶段付出的成本是n!。因此,它的表越多性能越差。

where 和on 的区别

1. 执行时间不同,on先执行从各个表中过滤数据后进行关联,再使用where对结果进行进一步过滤。

2. on只对被驱动表有效。

3.

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
20小时前
|
关系型数据库 MySQL 数据挖掘
【MySQL】多表连接查询
【MySQL】多表连接查询
|
8天前
|
SQL 关系型数据库 MySQL
mysql 数据库查询 查询字段用逗号隔开 关联另一个表并显示
mysql 数据库查询 查询字段用逗号隔开 关联另一个表并显示
18 2
|
10天前
|
关系型数据库 MySQL Shell
MySQL 查询
MySQL 查询
|
12天前
|
SQL 关系型数据库 MySQL
DQL语言之基础查询(mysql)
DQL语言之基础查询(mysql)
|
12天前
|
SQL 关系型数据库 MySQL
DQL语言之连接查询(mysql)
DQL语言之连接查询(mysql)
|
4天前
|
SQL 存储 关系型数据库
MySQL Cluster集群安装及使用
MySQL Cluster集群安装及使用
|
19天前
|
关系型数据库 MySQL 数据库
mysql卸载、下载、安装(window版本)
mysql卸载、下载、安装(window版本)
|
8天前
|
关系型数据库 MySQL 数据库
《MySQL 简易速速上手小册》第1章:MySQL 基础和安装(2024 最新版)
《MySQL 简易速速上手小册》第1章:MySQL 基础和安装(2024 最新版)
33 4
|
1月前
|
Ubuntu 关系型数据库 MySQL
Ubuntu 中apt 安装MySQL数据库
Ubuntu 中apt 安装MySQL数据库
69 0
|
1天前
|
关系型数据库 MySQL 数据安全/隐私保护
安装mysql和远程连接
安装mysql和远程连接
10 0