【大数据系列之MySQL】(二十二):MySQL中的分组查询group by

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 【大数据系列之MySQL】(二十二):MySQL中的分组查询group by

对于常见的函数都是单行函数,说白了就是一一映射,输入一个值则输出对应的值,但是MySQL中还存在聚合函数就是输入一组值则返回一个值,常见的例如:sum、max等

很多时候需要对数据中的某些字段进行分组,探究每组内的数据信息,这时就需要使用group by这个函数,该函数可以根据指定字段的值进行分组

案例1:查询每个部门的平均工资

SELECT
  department_id,
  avg( salary ) 
FROM
  employees 
GROUP BY
  department_id;

案例2:查询每个部门的人数

SELECT
  department_id,
  count(*) 
FROM
  employees 
GROUP BY
  department_id;

案例3:查询邮箱中包含a字符的,每个部门的平均工资

该案例中首先使用了where从起始表中筛选出含有a的,然后再从剩下的数据执行groupby函数进行聚合

SELECT
  avg( salary ),
  department_id 
FROM
  employees 
WHERE
  email LIKE '%a%' 
GROUP BY
  department_id;

案例4:查询部门员工数大于2的部门id

该sql首先根据部门id进行分组,然后对每个分组进行having判断,判断聚合后的每个组元素个数是否大于2

对于where和having都是用于筛选条件的,但是二者又有一些不同

数据源 位置 关键字
分组前筛选 原始表 group by子句的前面 where
分组后筛选 分组后的结果集 group by子句的后面 having
SELECT
  department_id,
  count(*) AS num 
FROM
  employees 
GROUP BY
  department_id 
HAVING
  num > 2;

案例5:按员工姓名的长度分组,查询每一组的员工个数,筛选员工个数大于5的有哪些?

SELECT
  LENGTH( last_name ) AS length,
  count(*) AS num 
FROM
  employees 
GROUP BY
  length 
HAVING
  num > 5;

首先是按照姓名的长度进行分组,这里为了方便可以起别名,分组之后每个组的结果集都是名字相同长度的,再使用having筛选出每个组员工个数大于5的组

案例6:查询每个部门每个工种的员工的平均工资

group by也是支持按照多个字段进行分组的

SELECT
  department_id,
  job_id,
  avg( salary ) 
FROM
  employees 
GROUP BY
  department_id,
  job_id;

案例7:查询每个部门每个工种的员工的平均工资,并且按平均工资的高低显示

这个排序是全局排序,就是聚合后每个组的内容合并到一起之后进行排序的,并不是组内排序

SELECT
  department_id,
  job_id,
  avg( salary ) 
FROM
  employees 
GROUP BY
  department_id,
  job_id 
ORDER BY
  avg( salary ) DESC;


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
201 66
|
16天前
|
存储 Oracle 关系型数据库
索引在手,查询无忧:MySQL索引简介
MySQL 是一款广泛使用的关系型数据库管理系统,在2024年5月的DB-Engines排名中得分1084,仅次于Oracle。本文介绍MySQL索引的工作原理和类型,包括B+Tree、Hash、Full-text索引,以及主键、唯一、普通索引等,帮助开发者优化查询性能。索引类似于图书馆的分类系统,能快速定位数据行,极大提高检索效率。
48 8
|
19天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
59 11
|
17天前
|
存储 分布式计算 安全
MaxCompute Bloomfilter index 在蚂蚁安全溯源场景大规模点查询的最佳实践
MaxCompute 在11月最新版本中全新上线了 Bloomfilter index 能力,针对大规模数据点查场景,支持更细粒度的数据裁剪,减少查询过程中不必要的数据扫描,从而提高整体的查询效率和性能。
|
22天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
87 6
|
2月前
|
负载均衡 大数据
大数据散列分区查询频率
大数据散列分区查询频率
23 5
|
2月前
|
存储 大数据 数据管理
大数据分区提高查询性能
大数据分区提高查询性能
38 2
|
2月前
|
SQL 前端开发 关系型数据库
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
68 9
|
2月前
|
存储 负载均衡 大数据
大数据水平分区提高查询性能
【11月更文挑战第2天】
47 4
|
2月前
|
缓存 监控 关系型数据库
如何优化MySQL查询速度?
如何优化MySQL查询速度?【10月更文挑战第31天】
144 3