文档备案控制台

开发者社区数据库文章正文

MySQL中去重 distinct 和 group by 是如何去重的

2023-08-10 498

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： MySQL中去重 distinct 和 group by 是如何去重的

1：测试数据

1CREATE TABLE student (
   stu_no  VARCHAR(40) NOT NULL,
   name VARCHAR(100) NOT NULL
);
insert into  student values('1','name1');
insert into  student values('2','name2');
insert into  student values('3','name1');
insert into  student values('4','name2');
insert into  student values('5','name1');.

测试1：对name 字段进行过滤

SELECT DISTINCT `name` FROM student;

测试2：对所有的字段进行去重。

SELECT DISTINCT * FROM student;

对比测试1和测试2 发现，

distinct 可以对单一字段进行去重，当对所有的字段去重时，只有不同数据的每个字段完全一样的数据被去掉，其他只有一个字段重复的数据并没有变化，因此得出结论：

distinct主要是针对全部字段去重，即去掉完全一样的数据。、

测试3：

1. select stu_no,name from student group by name;
2. select stu_no,name from student group by stu_no;

总结：

相同：distinct和group by都可以用来去重

不同之处，distinct针对全部字段去重，而group by可以针对全部字段中的单一字段去重。

两者执行方式不同，distinct主要是对数据两两进行比较，需要遍历整个表。group by分组类似先建立索引再查索引，当数据量较大时，group by速度要优于distinct。

文章标签：

云数据库 RDS MySQL 版

关系型数据库

索引

MySQL

关键词：

云数据库 RDS MySQL 版groupby

云数据库 RDS MySQL 版distinct

云数据库 RDS MySQL 版distinct groupby

云数据库 RDS MySQL 版GROUP

云数据库 RDS MySQL 版去重

相关实践学习

每个IT人都想学的“Web应用上云经典架构”实战

本实验从Web应用上云这个最基本的、最普遍的需求出发，帮助IT从业者们通过“阿里云Web应用上云解决方案”，了解一个企业级Web应用上云的常见架构，了解如何构建一个高可用、可扩展的企业级应用架构。

MySQL数据库入门学习

本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品：云数据库RDS MySQL 版阿里云关系型数据库RDS（Relational Database Service）是一种稳定可靠、可弹性伸缩的在线数据库服务，提供容灾、备份、恢复、迁移等方面的全套解决方案，彻底解决数据库运维的烦恼。了解产品详情: https://www.aliyun.com/product/rds/mysql 

夏木~

目录

相关文章

技术自由圈/原疯狂创客圈

|

SQL 关系型数据库 MySQL

MySQL group by 底层原理详解。group by 执行慢原因深度分析。（图解+秒懂+史上最全）

MySQL group by 底层原理详解。group by 执行慢原因深度分析。（图解+秒懂+史上最全）

技术自由圈/原疯狂创客圈

1178 0 0

MySQL group by 底层原理详解。group by 执行慢原因深度分析。（图解+秒懂+史上最全）

游客kufrkwrbkmpsa

|

SQL Oracle 关系型数据库

【YashanDB知识库】如何将mysql含有group by的SQL转换成崖山支持的SQL

本文探讨了在YashanDB（崖山数据库）中执行某些SQL语句时出现的报错问题，对比了MySQL的成功执行结果。问题源于SQL-92标准对非聚合列的严格限制，要求这些列必须出现在GROUP BY子句中，而SQL:1999及更高版本允许非聚合列直接出现在选择列中。YashanDB和Oracle遵循SQL-92标准，因此会报错。文章提供了两种解决方法：使用聚合函数处理非聚合列，或将GROUP BY与ORDER BY拆分为两层查询。最后总结指出，SQL-92标准更为严谨合理，建议开发者遵循此规范以避免潜在问题。

游客kufrkwrbkmpsa

325 7 7

1639437117631681

|

SQL Oracle 关系型数据库

【YashanDB 知识库】如何将 mysql 含有 group by 的 SQL 转换成崖山支持的 SQL

在崖山数据库中执行某些 SQL 语句时出现报错（YAS-04316 not a single-group group function），而这些语句在 MySQL 中能成功执行。原因是崖山遵循 SQL-92 标准，不允许选择列表中包含未在 GROUP BY 子句中指定的非聚合列，而 MySQL 默认允许这种操作。解决办法包括：使用聚合函数处理非聚合列或拆分查询为两层，先进行 GROUP BY 再排序。总结来说，SQL-92 更严格，确保数据一致性，MySQL 在 5.7 及以上版本也默认遵循此标准。

1639437117631681

349 1 1

wljslmz

|

SQL 关系型数据库 MySQL

在 MySQL 中使用 Distinct

【8月更文挑战第12天】

wljslmz

2254 4 4

在 MySQL 中使用 Distinct

蓝易云

|

关系型数据库 MySQL 索引

MySQL的group by与count(), *字段使用问题

正确使用 `GROUP BY`和 `COUNT()`函数是进行数据聚合查询的基础。通过理解它们的用法和常见问题，可以有效避免查询错误和性能问题。无论是在单列分组、多列分组还是结合其他聚合函数的场景中，掌握这些技巧和注意事项都能大大提升数据查询和分析的效率。

蓝易云

1725 0 0

蓝易云

|

关系型数据库 MySQL 数据处理

Mysql关于同时使用Group by和Order by问题

总的来说，`GROUP BY`和 `ORDER BY`的合理使用和优化，可以在满足数据处理需求的同时，保证查询的性能。在实际应用中，应根据数据的特性和查询需求，合理设计索引和查询结构，以实现高效的数据处理。

蓝易云

1829 1 1

wljslmz

|

SQL 关系型数据库 MySQL

在 MySQL 中使用 `GROUP BY` 子句

【8月更文挑战第12天】

wljslmz

1767 1 1

好奇的菜鸟

|

JSON 关系型数据库 MySQL

MySQL中GROUP_CONCAT与JSON_OBJECT、GROUP BY的巧妙结合：打造高效JSON数组汇总

MySQL中GROUP_CONCAT与JSON_OBJECT、GROUP BY的巧妙结合：打造高效JSON数组汇总

好奇的菜鸟

936 1 1

最好zzz

|

存储关系型数据库 MySQL

MySQL中的DISTINCT与GROUP BY：效率之争与实战应用

【8月更文挑战第12天】在数据库查询优化中，DISTINCT和GROUP BY常常被用来去重或聚合数据，但它们在实现方式和性能表现上却各有千秋。本文将深入探讨两者在MySQL中的效率差异，结合工作学习中的实际案例，为您呈现一场技术干货分享。

最好zzz

1630 0 0

java李杨勇

|

SQL 关系型数据库 MySQL

《零基础》MySQL GROUP BY 语句(十九)

GROUP BY 语句根据一个或多个列对结果集进行分组。在分组的列上我们可以使用 COUNT, SUM, AVG,等函数。 GROUP BY 语法

java李杨勇

248 0 0

热门文章

最新文章

阿里云DTS踩坑经验分享系列｜如何使用DTS进行MySQL->ClickHouse同步

mysql中有大量sleep进程的原因与解决办法

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

大数据-117 - Flink DataStream Sink 案例：写出到MySQL、写出到Kafka

[mysql]MGR简介与部署

mysql进阶(二十八)GRANT REVOKE用法详解

mysql数据库编写存储过程实现批量插入1000万条数据

CentOS安装mysql

DLA支持分析MongoDB/RDS只读实例

CentOS下源码安装Apache2.4+PHP5.4+MySQL5.5

【紧急救援】MySQL CPU 100%！一套组合拳教你快速定位并解决！

MySQL中日期和时间函数的使用指南

MySQL 与 Redis 如何保证双写一致性？

【赵渝强老师】MySQL的事务隔离级别

【Docker】（3）学习Docker中镜像与容器数据卷、映射关系！手把手带你安装 MySql主从同步和 Redis三主三从集群！并且进行主从切换与扩容操作，还有分析哈希分区等知识点！

MySQL源码编译安装

MySQL二进制包安装

MySQL包安装 -- SUSE系列（离线RPM包安装MySQL）

MySQL包安装 -- SUSE系列（SUSE资源库安装MySQL）

MySQL包安装 -- Debian系列（离线DEB包安装MySQL）

相关课程

更多

MySQL企业常见架构与调优经验分享

阿里云云原生数据仓库AnalyticDB MySQL版使用教程

MySQL实战进阶

阿里云数据库产品家族及特性

数据库及SQL/MySQL基础

云数据库MySQL快速入门

相关电子书

更多

阿里云MySQL云数据库产品体系介绍

One Box：解读事务与分析一体化数据库 HybridDB for MySQL

One Box：解读事务与分析一体化数据库HybridDB for MySQL

相关实验场景

更多

如何快速连接云数据库RDS MySQL

MySQL数据库快速部署实践

推荐镜像

更多

mysql

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！