Mysql中较为复杂的分组统计去重复值

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 这是我的代码:前提是做了一个view:att_sumbase首先分开统计每天的中午、下午饭点人数,这时需要分别去除中午和下午重复打卡的人。用了记录集的交,嵌套select的知识。注意不能直接使用union,这里只能使用union all,因为union会去掉重复记录,一个员工上午吃了,下午也吃了,union只会算一条,而union则能看出一共吃了两次。
这是我的代码:
前提是做了一个view:att_sumbase
首先分开统计每天的中午、下午饭点人数,这时需要分别去除中午和下午重复打卡的人。用了记录集的交,嵌套select的知识。
注意不能直接使用union,这里只能使用union all,因为union会去掉重复记录,一个员工上午吃了,下午也吃了,union只会算一条,而union则能看出一共吃了两次。

  1. //求出分组统计
  2. $att = $result->execute("select userid ,count(userid) as total,name from (select distinct userid,name from att_sumbase WHERE time BETWEEN '11:30' AND '12:30' union all select distinct userid,name from att_sumbase WHERE time BETWEEN '17:30' AND '18:30' order by userid) as foo group by userid");
  3.             
  4. //求得总数
  5. $sum = $result->execute("select sum(sum) as allnum from (select userid,count(distinct userid) as sum ,date,time,name from att_sumbase WHERE time BETWEEN '11:30' AND '12:30' union all select userid,count(distinct userid) as sum ,date,time,name from att_sumbase WHERE time BETWEEN '17:30' AND '18:30' ) as foo");


    以下是编程时的借鉴:    
  1. 在处理一个大数据量数据库的时候
  2. 突然发现mysql对于count(*)的不同处理会造成不同的结果
  3. 比如执行
  4. SELECT count(*) FROM tablename
  5. 即使对于千万级别的数据mysql也能非常迅速的返回结果
  6. 而对于
  7. SELECT count(*) FROM tablename WHERE.....
  8. mysql的查询时间开始攀升
  9. 仔细查阅累下手册,发现当没有WHERE语句对于整个mysql的表进行count运算的时候
  10. MyISAM类型的表中保存有总的行数,而当添加有WHERE限定语句的时候Mysql需要对整个表进行检索
  11. 从而得出count的数值
  12. 突然又想起来看到的不少新兴的php程序对于count的处理并没有很好的意识到这点
  13. 记录下
  14. 顺便提下mysql的DISTINCT的关键字有很多你想不到的用处
  15. 1.在count 不重复的记录的时候能用到
  16. 比如SELECT COUNT( DISTINCT id ) FROM tablename;
  17. 就是计算talbebname表中id不同的记录有多少条
  18. 2,在需要返回记录不同的id的具体值的时候可以用
  19. 比如SELECT DISTINCT id FROM tablename;
  20. 返回talbebname表中不同的id的具体的值
  21. 3.上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义
  22. 比如SELECT DISTINCT id, type FROM tablename;
  23. 实际上返回的是 id与type同时不相同的结果,也就是DISTINCT同时作用了两个字段,必须得id与tyoe都相同的才被排除了,与我们期望的结果不一样
  24. 4.这时候可以考虑使用group_concat函数来进行排除,不过这个mysql函数是在mysql4.1以上才支持的
  25. 5.其实还有另外一种解决方式,就是使用
  26. SELECT id, type, count(DISTINCT id) FROM tablename
  27. 虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据)
  28. 返回的结果是 只有id不同的所有结果和上面的4类型可以互补使用,就是看你需要什么样的数据了
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8月前
|
存储 SQL 关系型数据库
轻松入门MySQL:加速进销存!利用MySQL存储过程轻松优化每日销售统计(15)
轻松入门MySQL:加速进销存!利用MySQL存储过程轻松优化每日销售统计(15)
192 0
|
2月前
|
SQL NoSQL 关系型数据库
2024Mysql And Redis基础与进阶操作系列(5)作者——LJS[含MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页等详解步骤及常见报错问题所对应的解决方法]
MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页、INSERT INTO SELECT / FROM查询结合精例等详解步骤及常见报错问题所对应的解决方法
|
4月前
|
算法 关系型数据库 MySQL
MySQL高级篇——排序、分组、分页优化
排序优化建议、案例验证、范围查询时索引字段选择、filesort调优、双路排序和单路排序、分组优化、带排序的深分页优化
|
3月前
|
SQL 存储 关系型数据库
mysql 数据库空间统计sql
mysql 数据库空间统计sql
57 0
|
5月前
|
SQL 关系型数据库 MySQL
MySQL】-DQL(基本、条件、分组、排序、分页)详细版
通过这些查询方法,你可以高效地检索、分析和组织MySQL数据库中的数据,以满足各种应用需求。实践中,理解这些SQL语句的基础知识以及它们如何组合起来进行复杂的数据操作是至关重要的。
63 1
|
6月前
|
SQL 关系型数据库 MySQL
MySQL获取分组里的最新数据如何写sql
MySQL获取分组里的最新数据如何写sql
73 0
|
6月前
|
SQL 数据库 关系型数据库
MySQL设计规约问题之为什么统计表中记录数时推荐使用COUNT(*)而不是COUNT(primary_key)或COUNT(1)
MySQL设计规约问题之为什么统计表中记录数时推荐使用COUNT(*)而不是COUNT(primary_key)或COUNT(1)
|
8月前
|
SQL 关系型数据库 MySQL
【MySQL】DQL-分组查询-语法&where与having的区别&注意事项&可cv例题语句
【MySQL】DQL-分组查询-语法&where与having的区别&注意事项&可cv例题语句
【MySQL】DQL-分组查询-语法&where与having的区别&注意事项&可cv例题语句
|
7月前
|
关系型数据库 MySQL
10. Mysql 分组或汇总查询
10. Mysql 分组或汇总查询
66 1
|
8月前
|
SQL 关系型数据库 MySQL
简简单单 My SQL 学习笔记(2)——分组和简单数据的查询
简简单单 My SQL 学习笔记(2)——分组和简单数据的查询