MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
简介: MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
  • 根据查询结果删除sql
  • 先查询要删除的数据 在套用一层select
 DELETE 
FROM
 bo_eu_sample
WHERE
 id  IN ( SELECT id  from  ( SELECT id  from bo_eu_sample WHERE CREATEDATE like '2021-12-15 10%' )aa );

去除重复id

DELETE 
FROM
 trees_current_device_info_sub9 
WHERE
 id NOT IN ( SELECT id FROM ( SELECT MAX( id ) AS id FROM trees_current_device_info_sub9 GROUP BY deviceId, createTime ) aa );
  • 新增对比前一条与后一条数据
-- 新增 trees_current_device_info_sub9 
INSERT INTO trees_statistics9(aid, bid, datea, dateb, pl, deviceId, astatus, bstatus)
  SELECT a.id aid, b.id bid, a.createTime datea, b.createTime  dateb, TIMESTAMPDIFF(SECOND, a.createTime, b.createTime) pl, a.deviceId, a.`status`, b.`status`
  FROM   (SELECT   @arownum := @arownum + 1 rownum, id, createTime, deviceId, `status`
          FROM     trees_current_device_info_sub9, (SELECT @arownum := 0) t
          
          ORDER BY deviceId, createTime DESC) a,
         (SELECT   @brownum := @brownum + 1 rownum, id, createTime, deviceId, `status`
          FROM     trees_current_device_info_sub9, (SELECT @brownum := 1) t
          ORDER BY deviceId, createTime DESC ) b
  WHERE  a.rownum = b.rownum AND a.deviceId = b.deviceId AND DATE_FORMAT(a.createTime, '%Y-%m-%d') = DATE_FORMAT(b.createTime, '%Y-%m-%d') 

修改sql

UPDATE student AS A
INNER JOIN (
SELECT
    MAX( sc.SCORE ) AS maxscore,
    sc.ID AS maxid,
    sc.`SUBJECT` maxsub 
FROM
    score sc
    LEFT JOIN student st ON sc.ID = st.ID 
GROUP BY
    sc.ID 
    ) AS B ON A.ID = B.maxid 
    SET A.ID = B.maxid,
    A.SUBJECT = B.maxsub,
    A.score = B.maxscore
  SELECT deviceId,pl,date_format(datea,'%Y年-%m月-%d日') monthNo,astatus, SUM(count) realTotalDur,(24*60*60*30 )/pl SUMCOUNT ,ROUND(SUM(count)/((24*60*60*30)/pl),3) dayaavailability
 FROM `trees_availability` tay
 LEFT JOIN trees_device td
 ON td.id = tay.deviceId
 LEFT JOIN trees_lab tl
 ON tl.id = td.labId
 LEFT JOIN trees_device_type tdt
 ON tdt.id = td.deviceTypeId
 LEFT JOIN trees_device_baisc_type tdbt
 ON tdbt.id = tdt.deviceBasicType
 WHERE (astatus=1 OR astatus=3 ) AND (pl=10 OR pl=30) 
AND deviceId =78 group by deviceId,pl ,astatus,date_format(datea,'%Y年-%m月-%d日') ORDER BY date_format(datea,'%Y年-%m月-%d日');

删除重复的电子邮箱


DELETE p1 FROM Person p1,
    Person p2
WHERE
    p1.Email = p2.Email AND p1.Id > p2.Id

查找空闲设备

SELECT
  deviceId 
FROM
  time 
WHERE
  ( DATE_FORMAT( startTime, '%Y-%m-%d' ) >= '2022-01-05' AND DATE_FORMAT( endTime, '%Y-%m-%d ' ) <= '2022-01-12' ) 
  OR ( DATE_FORMAT( startTime, '%Y-%m-%d ' ) <= '2022-01-05' AND DATE_FORMAT( endTime, '%Y-%m-%d ' ) >= '2022-01-12' ) 
  OR ( DATE_FORMAT( endTime, '%Y-%m-%d ' ) >= '2022-01-05' AND DATE_FORMAT( endTime, '%Y-%m-%d ' ) <= '2022-01-12' )
  

三种去重方法

-- distinct
--列出 task_id 的所有唯一值(去重后的记录)
select distinct task_id from task;
 -- 任务总数
 select count(distinct task_id) task_numfrom task;
 -- distinct 通常效率较低。它不适合用来展示去重后具体的值,一般与 count 配合用来计算条数。
 
 -- group by
 
 
 -- 列出 task_id 的所有唯一值(去重后的记录,null也是值)
select task_id
from task
group by task_id;

-- 任务总数
select count(task_id) task_num
from (select task_id
      from task
      group by task_id) tmp;
      
-- row_number 是窗口函数,语法如下:
-- row_number() over (partition by <用于分组的字段名> order by <用于组内排序的字段名>)

-- 在支持窗口函数的 sql 中使用
select count(case when rn=1 then task_id else null end) task_num
from (select task_id
       , row_number() over (partition by task_id order by start_time) rn
   from Task) tmp;

窗口函数

-- 查询表中第二高的薪水  limit N, M 从第 N 条记录开始, 返回 M 条记录
-- 返回 N 条记录 返回 N 条记录

SELECT (SELECT DISTINCT Salary
FROM Employee
ORDER BY Salary DESC
LIMIT 1,1) 
AS SecondHighestSalary


SELECT 
IFNULL((SELECT DISTINCT Salary
FROM Employee
ORDER BY Salary DESC
LIMIT 1,1), NULL)
AS SecondHighestSalary

-- 分数应按从高到低排列。
-- 如果两个分数相等,那么两个分数的排名应该相同。
-- 在排名相同的分数后,排名数应该是下一个连续的整数。


-- dense_rank() dense_rank()

select score as "Score",dense_rank() over (order by score desc) as "Rank" from scores;


-- rank()  函数会把要求排序的值相同的归为一组且每组序号一样,排序不会连续执行

select score as "Score",rank() over (order by score desc) as "Rank" from scores;


-- ROW_NUMBER()在排名是序号 连续 不重复,即使遇到表中的两个一样的数值亦是如此

select score as "Score",row_number() over (order by score desc) as "Rank" from scores;

-- Ntile(group_num) 将所有记录分成group_num个组,每组序号一样

select score as "Score",Ntile(3) over (order by score desc) as "Rank" from scores;


子查询修改语句

UPDATE aoyi_yqb_product_spus per,
( SELECT aoyi_spu_id FROM aoyi_yqb_product_spus WHERE source_platform_id = '1' AND product_status = '1' AND aoyi_spu_id IN ( SELECT aoyi_sku_id FROM aoyi_product_sn_stock_eight WHERE stock_count < 4 ) ) bb 
SET per.product_status = '0' 
WHERE
  per.aoyi_spu_id = bb.aoyi_spu_id;


相关实践学习
自建数据库迁移到云数据库
本场景将引导您将网站的自建数据库平滑迁移至云数据库RDS。通过使用RDS,您可以获得稳定、可靠和安全的企业级数据库服务,可以更加专注于发展核心业务,无需过多担心数据库的管理和维护。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
9月前
|
SQL 人工智能 关系型数据库
如何实现MySQL百万级数据的查询?
本文探讨了在MySQL中对百万级数据进行排序分页查询的优化策略。面对五百万条数据,传统的浅分页和深分页查询效率较低,尤其深分页因偏移量大导致性能显著下降。通过为排序字段添加索引、使用联合索引、手动回表等方法,有效提升了查询速度。最终建议根据业务需求选择合适方案:浅分页可加单列索引,深分页推荐联合索引或子查询优化,同时结合前端传递最后一条数据ID的方式实现高效翻页。
446 0
|
8月前
|
存储 关系型数据库 MySQL
在CentOS 8.x上安装Percona Xtrabackup工具备份MySQL数据步骤。
以上就是在CentOS8.x上通过Perconaxtabbackup工具对Mysql进行高效率、高可靠性、无锁定影响地实现在线快速全量及增加式数据库资料保存与恢复流程。通过以上流程可以有效地将Mysql相关资料按需求完成定期或不定期地保存与灾难恢复需求。
584 10
|
9月前
|
SQL 存储 缓存
MySQL 如何高效可靠处理持久化数据
本文详细解析了 MySQL 的 SQL 执行流程、crash-safe 机制及性能优化策略。内容涵盖连接器、分析器、优化器、执行器与存储引擎的工作原理,深入探讨 redolog 与 binlog 的两阶段提交机制,并分析日志策略、组提交、脏页刷盘等关键性能优化手段,帮助提升数据库稳定性与执行效率。
223 0
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
703 13
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
505 9
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
331 6
|
SQL Oracle 关系型数据库
MySQL、SQL Server和Oracle数据库安装部署教程
数据库的安装部署教程因不同的数据库管理系统(DBMS)而异,以下将以MySQL、SQL Server和Oracle为例,分别概述其安装部署的基本步骤。请注意,由于软件版本和操作系统的不同,具体步骤可能会有所变化。
1349 3
|
存储 SQL C++
对比 SQL Server中的VARCHAR(max) 与VARCHAR(n) 数据类型
【7月更文挑战7天】SQL Server 中的 VARCHAR(max) vs VARCHAR(n): - VARCHAR(n) 存储最多 n 个字符(1-8000),适合短文本。 - VARCHAR(max) 可存储约 21 亿个字符,适合大量文本。 - VARCHAR(n) 在处理小数据时性能更好,空间固定。 - VARCHAR(max) 对于大文本更合适,但可能影响性能。 - 选择取决于数据长度预期和业务需求。
1352 1
|
SQL 存储 测试技术

推荐镜像

更多