解决Mysql中删除重复记录的问题

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: 题记本文主要介绍Mysql数据库表中,如何删除相同索引值、更新日期较早的记录行。

1、相同记录的由来

以Mysql为例,根据表的设计原则,表中不可能存在两条完全相同的记录。


第一范式(1NF):字段值具有原子性,不能再分(所有关系型数据库系统都满足第一范式);

例如:姓名字段,其中姓和名是一个整体,如果区分姓和名那么必须设立两个独立字段;


第二范式(2NF):一个表必须有主键,即每行数据都能被唯一的区分;  

(备注:必须先满足第一范式;)


第三范式(3NF):一个表中不能包涵其他相关表中非关键字段的信息,即数据表不能有沉余字段;( 备注:必须先满足第二范式;)

1

2

3

4

5

6

7

但是,在我们实际的业务系统中,很大可能会存在,除了主键外,剩余列完全相同或部分核心字段完全相同的数据在同一个库表中存在。


举例,如下截图所示:

image.png

该表中,主键为第1列ID和第2列Wid,两行数据的仅更新日期和标记列(2,3)不同,剩余列完全相同。

随着记录的增多,我们检索的需要,仅需要将Mid相同的记录保留住更新日期最新的一条记录。


2、如何仅保留最新日期的一条记录,删除其余日期较早的相同Wid的记录?

以下是删除操作sql的分解操作步骤。


步骤1:找出重复的记录。

select wid from   search_dispos_copy group by wid having count(wid) > 1;

1

步骤2:找出重复记录中,区分标志字段的最大值。

select max(update_time) from   search_dispos_copy group by article_id having count(wid )>1;

1

步骤3:查询出重复记录的ID信息。

select id, wid, update_time from search_dispos_copy

where wid in (select wid from search_dispos_copy group by wid having count(wid) > 1)

and update_time not in (select max(update_time) from search_dispos_copy group by wid having count(wid )>1);

order by wid;

1

2

3

4

步骤4:删除对应的ID记录。

整理出id信息,以逗号分隔,id是唯一值


1)删除空行操作

sed -i ‘/^$/d’ ./id_list.txt


2)换行符转化为逗号

cat id_list.txt | tr “\n” “,” > id_list_a.txt


3)删除操作

delete from msearch_dispose_articles_copy where id in ();

()里面放入4.2中 list_a存储的记录即可。


3、讨论

为了标注一条记录的状态,设计的时候我们会关联库表中的一条记录。但这条记录在库表中是唯一的,标注状态的改变体现在表中是相同记录行的某一特征列的改变。

因此,我们要做的是更新记录,而不是再次插入操作。

这样,也就避免了出现1中的“相同记录”。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
关系型数据库 MySQL 数据库
docker MySQL删除数据库时的错误(errno: 39)
docker MySQL删除数据库时的错误(errno: 39)
220 0
|
存储 关系型数据库 MySQL
mysql添加和删除数据库以及数据类型
mysql添加和删除数据库以及数据类型
169 1
|
关系型数据库 MySQL PHP
MySQL 删除数据库
MySQL 删除数据库
|
SQL 关系型数据库 MySQL
软件开发入门教程网之MySQL 删除数据库
使用普通用户登陆 MySQL 服务器,你可能需要特定的权限来创建或者删除 MySQL 数据库,所以我们这边使用 root 用户登录,root 用户拥有最高权限。
|
存储 运维 关系型数据库
头大了,Mysql写入数据十几秒后被自动删除了
事情是这样的,在公司内部新开发了一个功能还没有上线,目前部署在测试环境,Node服务会开启一个定时任务,每5分钟会处理好一部分数据写入到mysql数据库中。
270 0
头大了,Mysql写入数据十几秒后被自动删除了
|
SQL 关系型数据库 MySQL
删除 MySQL | 学习笔记
快速学习删除 MySQL.
153 0
删除 MySQL | 学习笔记
|
关系型数据库 MySQL
MySQL基础-删除/更新行为
添加了外键之后,再删除父表数据时产生的约束行为,我们就称为删除/更新行为。具体的删除/更新行为有以下几种:
314 0
|
关系型数据库 MySQL
mysql删除重复记录并且只保留一条【亲测可用】
mysql删除重复记录并且只保留一条【亲测可用】
274 0
|
SQL 关系型数据库 MySQL
软件开发入门教程网 之MySQL 删除数据库
使用普通用户登陆 MySQL 服务器,你可能需要特定的权限来创建或者删除 MySQL 数据库,所以我们这边使用 root 用户登录,root 用户拥有最高权限。 在删除数据库过程中,务必要十分谨慎,因为在执行删除命令后,所有数据将会消失。
|
关系型数据库 MySQL
mysql删除重复记录只保留一条
mysql删除重复记录只保留一条
183 0

推荐镜像

更多