【大数据系列之MySQL】(二十二):MySQL中的分组查询group by

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 【大数据系列之MySQL】(二十二):MySQL中的分组查询group by

对于常见的函数都是单行函数,说白了就是一一映射,输入一个值则输出对应的值,但是MySQL中还存在聚合函数就是输入一组值则返回一个值,常见的例如:sum、max等

很多时候需要对数据中的某些字段进行分组,探究每组内的数据信息,这时就需要使用group by这个函数,该函数可以根据指定字段的值进行分组

案例1:查询每个部门的平均工资

SELECT
  department_id,
  avg( salary ) 
FROM
  employees 
GROUP BY
  department_id;

案例2:查询每个部门的人数

SELECT
  department_id,
  count(*) 
FROM
  employees 
GROUP BY
  department_id;

案例3:查询邮箱中包含a字符的,每个部门的平均工资

该案例中首先使用了where从起始表中筛选出含有a的,然后再从剩下的数据执行groupby函数进行聚合

SELECT
  avg( salary ),
  department_id 
FROM
  employees 
WHERE
  email LIKE '%a%' 
GROUP BY
  department_id;

案例4:查询部门员工数大于2的部门id

该sql首先根据部门id进行分组,然后对每个分组进行having判断,判断聚合后的每个组元素个数是否大于2

对于where和having都是用于筛选条件的,但是二者又有一些不同

数据源 位置 关键字
分组前筛选 原始表 group by子句的前面 where
分组后筛选 分组后的结果集 group by子句的后面 having
SELECT
  department_id,
  count(*) AS num 
FROM
  employees 
GROUP BY
  department_id 
HAVING
  num > 2;

案例5:按员工姓名的长度分组,查询每一组的员工个数,筛选员工个数大于5的有哪些?

SELECT
  LENGTH( last_name ) AS length,
  count(*) AS num 
FROM
  employees 
GROUP BY
  length 
HAVING
  num > 5;

首先是按照姓名的长度进行分组,这里为了方便可以起别名,分组之后每个组的结果集都是名字相同长度的,再使用having筛选出每个组员工个数大于5的组

案例6:查询每个部门每个工种的员工的平均工资

group by也是支持按照多个字段进行分组的

SELECT
  department_id,
  job_id,
  avg( salary ) 
FROM
  employees 
GROUP BY
  department_id,
  job_id;

案例7:查询每个部门每个工种的员工的平均工资,并且按平均工资的高低显示

这个排序是全局排序,就是聚合后每个组的内容合并到一起之后进行排序的,并不是组内排序

SELECT
  department_id,
  job_id,
  avg( salary ) 
FROM
  employees 
GROUP BY
  department_id,
  job_id 
ORDER BY
  avg( salary ) DESC;


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
5天前
|
SQL 缓存 关系型数据库
MySQL高级篇——关联查询和子查询优化
左外连接:优先右表创建索引,连接字段类型要一致、内连接:驱动表由数据量和索引决定、 join语句原理、子查询优化:拆开查询或优化成连接查询
MySQL高级篇——关联查询和子查询优化
|
5天前
|
算法 关系型数据库 MySQL
MySQL高级篇——排序、分组、分页优化
排序优化建议、案例验证、范围查询时索引字段选择、filesort调优、双路排序和单路排序、分组优化、带排序的深分页优化
MySQL高级篇——排序、分组、分页优化
|
8天前
|
SQL 关系型数据库 MySQL
MySQL查询(万字超详细版)
本文详细介绍了数据库中的单表和多表查询方法。首先,单表查询包括全列查询、指定列查询及去重查询,其中应避免使用`*`以提高效率。接着,文章讲解了排序查询,包括升序和降序,并展示了如何通过多个字段进行排序。在多表查询部分,本文解释了内连接、外连接(左外连接和右外连接)以及自连接的概念和用法,提供了丰富的代码示例
21 1
MySQL查询(万字超详细版)
|
2天前
|
存储 缓存 关系型数据库
MySQL 查询优化方法
在数据库应用中,高效的查询性能至关重要。本文探讨了常用的 MySQL 查询优化方法,包括索引优化(选择合适的索引字段、复合索引、定期维护索引)、查询语句优化(避免全表扫描、限制返回行数、避免使用不必要的函数)、表结构优化(选择合适的数据类型、分区表、定期清理无用数据)及数据库配置优化(调整缓存大小、优化存储引擎参数)。通过这些方法,可以显著提高 MySQL 的查询性能,为应用程序提供更好的用户体验。
|
20天前
|
自然语言处理 关系型数据库 MySQL
MySQL MATCH 匹配中文 无法查询的问题如何处理?
【8月更文挑战第29天】MySQL MATCH 匹配中文 无法查询的问题如何处理?
67 6
|
20天前
|
SQL 存储 关系型数据库
mysql查询怎么用
mysql查询怎么用【8月更文挑战第31天】
18 4
|
19天前
|
SQL 关系型数据库 MySQL
|
14天前
|
存储 大数据 数据挖掘
【数据新纪元】Apache Doris:重塑实时分析性能,解锁大数据处理新速度,引爆数据价值潜能!
【9月更文挑战第5天】Apache Doris以其卓越的性能、灵活的架构和高效的数据处理能力,正在重塑实时分析的性能极限,解锁大数据处理的新速度,引爆数据价值的无限潜能。在未来的发展中,我们有理由相信Apache Doris将继续引领数据处理的潮流,为企业提供更快速、更准确、更智能的数据洞察和决策支持。让我们携手并进,共同探索数据新纪元的无限可能!
61 11
|
20天前
|
存储 分布式计算 大数据
MaxCompute 数据分区与生命周期管理
【8月更文第31天】随着大数据分析需求的增长,如何高效地管理和组织数据变得至关重要。阿里云的 MaxCompute(原名 ODPS)是一个专为海量数据设计的计算服务,它提供了丰富的功能来帮助用户管理和优化数据。本文将重点讨论 MaxCompute 中的数据分区策略和生命周期管理方法,并通过具体的代码示例来展示如何实施这些策略。
51 1
|
25天前
数据平台问题之在数据影响决策的过程中,如何实现“决策/行动”阶段
数据平台问题之在数据影响决策的过程中,如何实现“决策/行动”阶段

热门文章

最新文章