解决Mysql中删除重复记录的问题

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 题记本文主要介绍Mysql数据库表中,如何删除相同索引值、更新日期较早的记录行。

1、相同记录的由来

以Mysql为例,根据表的设计原则,表中不可能存在两条完全相同的记录。


第一范式(1NF):字段值具有原子性,不能再分(所有关系型数据库系统都满足第一范式);

例如:姓名字段,其中姓和名是一个整体,如果区分姓和名那么必须设立两个独立字段;


第二范式(2NF):一个表必须有主键,即每行数据都能被唯一的区分;  

(备注:必须先满足第一范式;)


第三范式(3NF):一个表中不能包涵其他相关表中非关键字段的信息,即数据表不能有沉余字段;( 备注:必须先满足第二范式;)

1

2

3

4

5

6

7

但是,在我们实际的业务系统中,很大可能会存在,除了主键外,剩余列完全相同或部分核心字段完全相同的数据在同一个库表中存在。


举例,如下截图所示:

image.png

该表中,主键为第1列ID和第2列Wid,两行数据的仅更新日期和标记列(2,3)不同,剩余列完全相同。

随着记录的增多,我们检索的需要,仅需要将Mid相同的记录保留住更新日期最新的一条记录。


2、如何仅保留最新日期的一条记录,删除其余日期较早的相同Wid的记录?

以下是删除操作sql的分解操作步骤。


步骤1:找出重复的记录。

select wid from   search_dispos_copy group by wid having count(wid) > 1;

1

步骤2:找出重复记录中,区分标志字段的最大值。

select max(update_time) from   search_dispos_copy group by article_id having count(wid )>1;

1

步骤3:查询出重复记录的ID信息。

select id, wid, update_time from search_dispos_copy

where wid in (select wid from search_dispos_copy group by wid having count(wid) > 1)

and update_time not in (select max(update_time) from search_dispos_copy group by wid having count(wid )>1);

order by wid;

1

2

3

4

步骤4:删除对应的ID记录。

整理出id信息,以逗号分隔,id是唯一值


1)删除空行操作

sed -i ‘/^$/d’ ./id_list.txt


2)换行符转化为逗号

cat id_list.txt | tr “\n” “,” > id_list_a.txt


3)删除操作

delete from msearch_dispose_articles_copy where id in ();

()里面放入4.2中 list_a存储的记录即可。


3、讨论

为了标注一条记录的状态,设计的时候我们会关联库表中的一条记录。但这条记录在库表中是唯一的,标注状态的改变体现在表中是相同记录行的某一特征列的改变。

因此,我们要做的是更新记录,而不是再次插入操作。

这样,也就避免了出现1中的“相同记录”。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
581
分享
相关文章
docker MySQL删除数据库时的错误(errno: 39)
docker MySQL删除数据库时的错误(errno: 39)
191 0
软件开发入门教程网之MySQL 删除数据库
使用普通用户登陆 MySQL 服务器,你可能需要特定的权限来创建或者删除 MySQL 数据库,所以我们这边使用 root 用户登录,root 用户拥有最高权限。
头大了,Mysql写入数据十几秒后被自动删除了
事情是这样的,在公司内部新开发了一个功能还没有上线,目前部署在测试环境,Node服务会开启一个定时任务,每5分钟会处理好一部分数据写入到mysql数据库中。
242 0
头大了,Mysql写入数据十几秒后被自动删除了
MySQL基础-删除/更新行为
添加了外键之后,再删除父表数据时产生的约束行为,我们就称为删除/更新行为。具体的删除/更新行为有以下几种:
254 0
mysql删除重复记录并且只保留一条【亲测可用】
mysql删除重复记录并且只保留一条【亲测可用】
206 0
软件开发入门教程网 之MySQL 删除数据库
使用普通用户登陆 MySQL 服务器,你可能需要特定的权限来创建或者删除 MySQL 数据库,所以我们这边使用 root 用户登录,root 用户拥有最高权限。 在删除数据库过程中,务必要十分谨慎,因为在执行删除命令后,所有数据将会消失。