在介绍GROUP BY 和 HAVING 子句前,我们必需先讲讲sql语言中一种特殊的函数:聚合函数,例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。
SELECT SUM(population) FROM bbc
这里的SUM作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有国家的总人口数。
通过使用GROUP BY 子句,可以让SUM 和 COUNT 这些函数对属于一组的数据起作用。当你指定 GROUP BY region 时, 属于同一个region(地区)的一组数据将只能返回一行值,也就是说,表中所有除region(地区)外的字段,只能通过 SUM, COUNT等聚合函数运算后返回一个值。
HAVING子句可以让我们筛选成组后的各组数据,WHERE子句在聚合前先筛选记录.也就是说作用在GROUP BY 子句和HAVING子句前.
而 HAVING子句在聚合后对组记录进行筛选。
让我们还是通过具体的实例来理解GROUP BY 和 HAVING 子句,还采用第三节介绍的bbc表。
SQL实例:
一、显示每个地区的总人口数和总面积:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。
二、 显示每个地区的总人口数和总面积.仅显示那些面积超过1000000的地区。
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(area)>1000000
在这里,我们不能用where来筛选超过1000000的地区,因为表中不存在这样一条记录。
相反,HAVING子句可以让我们筛选成组后的各组数据.
*****************************
总体介绍如下:
个人觉得group by 与distinct 去除重复的值有相同的概念上的理解。
可以理解为group by 就是 distinct的一种形式,不过更加的功能多些。
1、sql语句select的执行过程
(1)根据where字句的条件表达式,从from子句指定的基本表或视图中找到满足条件的元组。
(2)再按select子句中的目标列的表达式,选出元组的属性值形成结果表。
(3)如果有group子句,则将结果表按group中指定的列进行分组,该属性列值相等的元组为一组,通常会在每组中作用集函数。
(4)如果group子句带having短语,则只有满足having指定条件的组才输出。
(5)如果有order子句,则将结果表按order子句指定的列升序或降序排序。
2、group by 子句的将查询结果表按某一列或多列分组,值相等的为一组。对查询结果分组的目的是为了细化集函数的作用对象。如果未对查询结果分组,集函数将作用与整个查询结果。
注意:如果没有group by 子句,select 列表中不允许出现字段与分组函数混用的情况。出现在select列表中的字段,如果不是包含在分组函数中,那么该字段必须同时出在Group by子句中。
eg:select deptno,count(*) from emp group by deptno;----前后的列表字段一致
having子句允许用户指定对一个记录组的搜索条件。而通常的where查询条件只针对单记录,不针对记录组。
eg:select deptno,count(*) from emp group by deptno having count(*)>3;
注意:group by 可以与where 来搭配使用,where 只能在group by 的前面,group by后面不能使用where;where 子句不能包括分组函数,条件的表达只能使用having表示。