GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS Agent(兼容Hermes Agent),2核4GB
PolarDB Agent Express,2核4GB
简介: GROUP BY是日常开发中使用频率最高的操作之一,也是最容易写出慢查询的地方。很多人以为加了索引就万事大吉,但面对复杂场景仍然会遇到性能问题。本文从GROUP BY的执行机制出发,拆解临时表和文件排序的触发条件,讲解索引优化、MySQL 8.0新特性、大数据量下的近似分组方案,以及GROUP BY与窗口函数的组合运用,帮助读者写出既正确又高效的分组查询。

大家好,我是小耶,写功课只是为了我踩过的坑,你们别再踩了!

前几周我们讲了执行计划、索引设计、COUNT优化、事务隔离级别,今天来聊聊一个日常开发中使用频率极高、但也最容易出问题的话题:​GROUP BY​。

某天凌晨1点,报表系统卡了半小时。执行计划里赫然写着:Using where; Using temporary; Using filesort。这三个词凑在一起,意味着MySQL在内存里建了张临时表,把3000万行数据一行行插进去,然后全表扫描排序,最后返回10行。

这不是SQL,这是CPU烤机程序。

很多人以为“GROUP BY不就是分个组吗”,但实际上它的执行流程远比表面复杂。今天我们从执行机制出发,把GROUP BY的性能陷阱一个一个拆开讲。

先搞清楚:GROUP BY到底在做什么?

执行一条GROUP BY查询时,数据库做了三件事:

  1. 排序​:把数据按分组字段排序。只有相同值的行挨在一起,才能分组统计。
  2. 分组​:遍历排序后的结果,遇到相同值累加,遇到新值新开分组。
  3. (可选)再排序​:如果还有ORDER BY,再做一次排序。

问题的核心在于​第一步——排序​。如果分组字段上没有合适的索引,MySQL无法直接按顺序遍历数据,就只能建一张临时表,把符合条件的行全插进去,对临时表做filesort,再遍历分组。3000万行数据,先写临时表、再全表排序、再遍历——每一步都在烧CPU和磁盘I/O。

Using temporary和Using filesort什么时候触发?

触发Using temporary的规则​:如果GROUP BY的列没有可用索引,MySQL就必须先排序才能分组,而排序需要空间,于是建临时表。

但“可用索引”比你以为的苛刻——不是有索引就行,索引列的顺序决定一切。比如order_time有索引但city没有,执行SELECT city, COUNT(*) FROM orders WHERE order_time >= '2026-04-01' GROUP BY city,虽然order_time可以过滤数据,但过滤后的数据按city分组时city没有索引,仍然会触发临时表。

触发Using filesort的规则​:当GROUP BY的结果需要排序(比如ORDER BY cnt DESC),且排序无法利用索引完成时,就会触发filesort。

索引优化的核心原则

GROUP BY优化的根本思路是让分组字段走索引,避免临时表和文件排序

原则一:GROUP BY列必须形成索引的最左前缀

MySQL使用索引进行GROUP BY时,分组列必须是某个索引的最左前缀。如果表上有索引(c1, c2, c3)GROUP BY c1, c2可以利用索引,但GROUP BY c2, c3不行——因为c2不是最左前缀。

原则二:索引顺序决定一切——WHERE条件中的范围查询是分水岭

当WHERE条件中包含范围查询(><BETWEEN)时,索引的使用会受到限制。如果WHERE中有范围条件,范围条件涉及的列必须放在索引的后面,GROUP BY列必须前置

举例:查询“2026年4月之后的订单,按城市分组统计订单数”:

sql

SELECT city, COUNT(*) 
FROM orders 
WHERE order_time >= '2026-04-01' 
GROUP BY city;

推荐索引:(city, order_time) —— GROUP BY列city在前,范围条件order_time在后。

如果把索引建为(order_time, city),虽然order_time能过滤数据,但过滤后的数据按city分组时,city不在索引的前缀位置,依然会触发临时表。

原则三:覆盖索引进一步提速

如果索引不仅包含GROUP BY列,还包含聚合函数需要的列,查询可以直接从索引返回结果,不需要回表。例如SELECT city, SUM(amount) FROM orders GROUP BY city,索引(city, amount)可以让MySQL直接从索引完成分组和聚合。

MySQL 8.0的两大优化

优化一:取消GROUP BY的隐式排序

在MySQL 5.7及之前,GROUP BY默认会按分组字段排序。如果不需要排序结果,可以添加ORDER BY NULL来消除排序开销。

MySQL 8.0取消了GROUP BY的隐式排序。如果确实需要排序,必须显式写ORDER BY。这避免了不必要的排序开销,是一个值得关注的性能优化点。

优化二:Loose Index Scan(松散索引扫描)

这是MySQL使用索引处理GROUP BY的最高效方式。当GROUP BY列是索引的最左前缀时,MySQL可以“松散地”扫描索引,跳过不属于当前组的数据,只读取每个组的第一个键值。

举例:表有索引(c1, c2, c3),查询GROUP BY c1, c2,Loose Index Scan只需要读取每个(c1, c2)组合的第一行,而不是扫描所有行。当没有WHERE条件时,扫描的行数等于分组数,远小于总行数。

大数据量下的近似分组

当数据量极大且业务允许误差时,可以考虑近似分组方案:

  • 采样估算​:对数据进行抽样(如WHERE id % 100 = 0),在样本上做GROUP BY,再按比例放大结果。适用于趋势分析、快速报表。
  • 预计算汇总表​:对于固定维度的分组统计(如每日、每小时的聚合),可以定时计算并存入汇总表,查询直接读汇总表。
  • 分区表优化​:在大数据量场景下,结合分区表设计可以进一步减少数据扫描范围。

GROUP BY + 窗口函数的组合运用

分组后计算占比、同比等场景,GROUP BY和窗口函数可以组合使用:

-- 计算每个城市订单数占总订单数的比例
SELECT city, 
       COUNT(*) AS city_cnt,
       COUNT(*) / SUM(COUNT(*)) OVER () AS ratio
FROM orders
GROUP BY city;

窗口函数在分组后的结果集上计算,不需要二次聚合,比子查询写法更简洁高效。

总结

GROUP BY的性能问题,根源往往在​索引设计​。理解临时表和文件排序的触发条件,遵循“GROUP BY列前置、范围条件后置、覆盖索引收尾”的索引设计原则,再配合MySQL 8.0的Loose Index Scan和取消隐式排序等新特性,就能让分组查询从“CPU烤机程序”变成“秒级响应”。遇到大数据量且业务允许误差时,采样估算和预计算也是值得考虑的方案。

小耶在手,SQL 不愁

还有什么想了解的,欢迎留言!小耶一定知无不言言无不尽……我们下次见~

相关文章
|
4天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1595 2
|
1天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
352 123
|
4天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
593 4
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
15天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
15天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
921 12
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
8天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
676 0
|
3天前
|
消息中间件 人工智能 Kafka
AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法
本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复杂度的同时,兼顾实时性、一致性、Schema 演进、CDC 语义与开放生态兼容。
193 121
|
3天前
|
人工智能 监控 前端开发
Electron 监控:让桌面 Agent 监控触手可及
一行代码实现Electron桌面端全景监控,自动还原崩溃现场、预警内存泄漏、全链路追踪、 SSE流式响应与交互埋点,让 AI 助手运行状态清晰可见,助力快速恢复稳定与流畅。
184 125
|
11天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
546 0