mysql子查询、聚合函数-阿里云开发者社区

mysql子查询、聚合函数

2024-04-08 291

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： mysql子查询、聚合函数

一、聚合函数

1、什么是聚合函数

对一组数据进行汇总的函数，输入的是一组数据的集合，输出的是单个值。

2、五大聚合函数

2.1、可以对数值型数据使用AVG 和 SUM 函数。

2.2、可以对任意数据类型的数据使用 MIN 和 MAX 函数

2.3、COUNT函数

COUNT(*)返回表中记录总数，适用于任意数据类型

COUNT(expr) 返回expr不为空的记录总数

问题：用count(*)，count(1)，count(列名)谁好呢?

其实，对于MyISAM引擎的表是没有区别的。这种引擎内部有一计数器在维护着行数。

Innodb引擎的表用count(*),count(1)直接读行数，复杂度是O(n)，因为innodb真的要去数一遍。但好

于具体的count(列名)。

问题：能不能使用count(列名)替换count(*)?

不要使用 count(列名)来替代 count(*) ， count(*) 是 SQL92 定义的标准统计行数的语法，跟数

据库无关，跟 NULL 和非 NULL 无关。

说明：count(*)会统计值为 NULL 的行，而 count(列名)不会统计此列为 NULL 值的行。

2.4、其他函数

中位差标准差等

3、group by

基本使用

可以使用GROUP BY子句将表中的数据分成若干组

SELECT column, group_function(column)

FROM table

[WHERE condition]

[GROUP BY group_by_expression]

[ORDER BY column];

比如：求出员工表中各个部门的平均工资？

SELECT department_id, AVG(salary)

FROM employees

GROUP BY department_id ;

在SELECT列表中所有未包含在组函数中的列都应该包含在 GROUP BY子句中

包含在 GROUP BY 子句中的列不必包含在SELECT 列表中

使用多个列分组

SELECT department_id dept_id, job_id, SUM(salary)

FROM employees

GROUP BY department_id, job_id ;

GROUP BY中使用WITH ROLLUP

使用 WITH ROLLUP 关键字之后，在所有查询出的分组记录之后增加一条记录，该记录计算查询出的所有记录的总和，即统计记录数量。

SELECT department_id,AVG(salary)

FROM employees

WHERE department_id > 80

GROUP BY department_id WITH ROLLUP;

注意：当使用ROLLUP时，不能同时使用ORDER BY子句进行结果排序，即ROLLUP和ORDER BY是互相排斥的。

二、HAVING

基本使用

用来过滤数组，前面过滤数组使用where， HAVING 必须要与 GROUP BY 配合使用

部门最高工资比10000高的部门

selecct depId max(salaly) from dep group by depId having max(salaly) >10000

使用要求

如果过滤条件中使用了聚合函数则必须使用having而不能使用where

having必须卸载group by后面

having和group一起使用

WHERE和HAVING的对比

区别1：WHERE 可以直接使用表中的字段作为筛选条件，但不能使用分组中的计算函数作为筛选条件；

HAVING 必须要与 GROUP BY 配合使用，可以把分组计算的函数和分组字段作为筛选条件。

这决定了，在需要对数据进行分组统计的时候，HAVING 可以完成 WHERE 不能完成的任务。这是因为，

在查询语法结构中，WHERE 在 GROUP BY 之前，所以无法对分组结果进行筛选。HAVING 在 GROUP BY 之

后，可以使用分组字段和分组中的计算函数，对分组的结果集进行筛选，这个功能是 WHERE 无法完成

的。另外，WHERE排除的记录不再包括在分组中。

区别2：如果需要通过连接从关联表中获取需要的数据，WHERE 是先筛选后连接，而 HAVING 是先连接

后筛选。这一点，就决定了在关联查询中，WHERE 比 HAVING 更高效。因为 WHERE 可以先筛选，用一

个筛选后的较小数据集和关联表进行连接，这样占用的资源比较少，执行效率也比较高。HAVING 则需要

先把结果集准备好，也就是用未被筛选的数据集进行关联，然后对这个大的数据集进行筛选，这样占用

的资源就比较多，执行效率也较低。

小结如下：

开发中的选择： WHERE 和 HAVING 也不是互相排斥的，我们可以在一个查询里面同时使用 WHERE 和 HAVING。包含分组统计函数的条件用 HAVING，普通条件用 WHERE。这样，我们就既利用了 WHERE 条件的高效快速，又发挥了 HAVING 可以使用包含分组统计函数的查询条件的优点。当数据量特别大的时候，运行效率会有很大的差别。

三、select执行过程

查询结构

方式1：

SELECT ...,....,...

FROM ...,...,....

WHERE 多表的连接条件

AND 不包含组函数的过滤条件

GROUP BY ...,...

HAVING 包含组函数的过滤条件

ORDER BY ... ASC/DESC

LIMIT ...,...

#方式2：

SELECT ...,....,...

FROM ... JOIN ...

ON 多表的连接条件

JOIN ...

ON ...

WHERE 不包含组函数的过滤条件

AND/OR 不包含组函数的过滤条件

GROUP BY ...,...

HAVING 包含组函数的过滤条件

ORDER BY ... ASC/DESC

LIMIT ...,...

#其中：

#（1）from：从哪些表中筛选

#（2）on：关联多表查询时，去除笛卡尔积

#（3）where：从表中筛选的条件

#（4）group by：分组依据

#（5）having：在统计结果中再次筛选

#（6）order by：排序

#（7）limit：分页

Sql执行顺序

SQL 的执行原理

四、子查询

1、什么是子查询

子查询指一个查询语句嵌套在另一个查询语句内部的查询

2、子查询比较操作符

实例1：查询最低工资大于50号部门最低工资的部门id和其最低工资

SELECT department_id, MIN(salary)

FROM employees

GROUP BY department_id

HAVING MIN(salary) >

(SELECT MIN(salary)

FROM employees

WHERE department_id = 50);

实列2：查询平均工资最低的部门id

SELECT department_id

FROM employees

GROUP BY department_id

HAVING AVG(salary) <= ALL (

SELECT AVG(salary) avg_sal

FROM employees

GROUP BY department_id

)

3、空值问题

如果子查询没有结果出现no rows selected错误提示

4、相关子查询

如果子查询的执行依赖于外部查询，通常情况下都是因为子查询中的表用到了外部的表，并进行了条件关联，因此每执行一次外部查询，子查询都要重新计算一次，这样的子查询就称之为关联子查询。

5、 EXISTS 与 NOT EXISTS关键字

关联子查询通常也会和 EXISTS操作符一起来使用，用来检查在子查询中是否存在满足条件的行。

如果在子查询中不存在满足条件的行：条件返回 FALSE 继续在子查询中查找

如果在子查询中存在满足条件的行：不在子查询中继续查找条件返回 TRUE NOT EXISTS关键字表示如果不存在某种条件，则返回TRUE，否则返回FALSE。

6、相关更新删除

使用相关子查询依据一个表中的数据更新另一个表的数据。

UPDATE table1 alias1

SET column = (SELECT expression

FROM table2 alias2

WHERE alias1.column = alias2.column);

使用相关子查询依据一个表中的数据删除另一个表的数据

DELETE FROM table1 alias1

WHERE column operator (SELECT expression

FROM table2 alias2

WHERE alias1.column = alias2.column);

7、自连接方式和子查询方式哪个好？

谁的工资比Abel的高？

#方式1：自连接

SELECT e2.last_name,e2.salary

FROM employees e1,employees e2

WHERE e1.last_name = 'Abel'

AND e1.`salary` < e2.`salary`

#方式2：子查询

SELECT last_name,salary

FROM employees

WHERE salary > (

SELECT salary

FROM employees

WHERE last_name = 'Abel'

)

题目中可以使用子查询，也可以使用自连接。一般情况建议你使用自连接，因为在许多 DBMS 的处理过程中，对于自连接的处理速度要比子查询快得多。

可以这样理解：子查询实际上是通过未知表进行查询后的条件判断，而自连接是通过已知的自身数据表进行条件判断，因此在大部分 DBMS 中都对自连接处理进行了优化。

mysql子查询、聚合函数

一、聚合函数

1、什么是聚合函数

2、五大聚合函数

3、group by

二、HAVING

三、select执行过程

四、子查询

1、什么是子查询

2、子查询比较操作符

3、空值问题

4、相关子查询

5、 EXISTS 与 NOT EXISTS关键字

6、相关更新删除

7、自连接方式和子查询方式哪个好？

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

mysql子查询、聚合函数

一、聚合函数

1、什么是聚合函数

2、五大聚合函数

3、group by

二、HAVING

三、select执行过程

四、子查询

1、什么是子查询

2、子查询比较操作符

3、空值问题

4、 相关子查询

5、 EXISTS 与 NOT EXISTS关键字

6、 相关更新 删除

7、 自连接方式和子查询方式哪个好？

热门文章

最新文章

相关课程

相关电子书

推荐镜像

4、相关子查询

6、相关更新删除

7、自连接方式和子查询方式哪个好？