值得收藏:当向数据库导入大量数据时,mysql主键唯一键重复插入,如何丝滑操作并不导入重复数据呢

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 最近要导入大量数据到数据库,数据库中有数据列要求唯一的,也就是唯一键,但是我拿到的数据有部分重复,一运行就会出错,如果把重复数据找出来,删除后在导入,太麻烦了,所以想要丝滑导入,并忽略重复数据,有了下面的解决方案:本次案例使用phpmyadmin进行演示

最近要导入大量数据到数据库,数据库中有数据列要求唯一的,也就是唯一键,但是我拿到的数据有部分重复,一运行就会出错,如果把重复数据找出来,删除后在导入,太麻烦了,所以想要丝滑导入,并忽略重复数据,有了下面的解决方案:

本次案例使用phpmyadmin进行演示


1.准备

比如我有如下的数据表(order):orderNo为唯一列

网络异常,图片无法展示
|

目前表中已存在如下数据:

网络异常,图片无法展示
|


建表代码如下:当然你也可以使用PHPmyadmin或者Navicat等管理工具,使用可视化的方式创建数据库和表


--建表CREATE DATABASE hotel;---- 表的结构 `order`--CREATETABLE IF NOT EXISTS `order` (  `id` int(11)NOTNULL AUTO_INCREMENT,  `orderNo` varchar(80)NOTNULL DEFAULT '0',  `proId` int(11)NOTNULL DEFAULT '0',  PRIMARY KEY (`id`),  UNIQUE KEY `orderNo` (`orderNo`)) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4 AUTO_INCREMENT=6;---- 转存表中的数据 `order`--INSERTINTO `order` (`id`, `orderNo`, `proId`)VALUES(1,'12345678',1),(2,'12345676',1),(3,'12345876',2),(4,'12345877',2),(5,'12345879',3);


我现在拿到的数据如下:


网络异常,图片无法展示
|

INSERTINTO `order` ( `orderNo`, `proId`)VALUES('12345678',1),('12345696',1),('12345886',2),('12345877',2),('32345817',2),('12345827',2),('12345887',2),('12345849',3);

上面的数据中有多条重复,如果这时候导入,会出现下面的报错:

网络异常,图片无法展示
|

执行到第一条的时候就已经有重复的数据.所以在执行导入第一条数据时就会报错,剩下的数据不会再继续执行,但是如果导入的数据中前面没有重复的,只是中间某一条和数据库orderNo列已存在的数据重复,前面重复的数据会导入,直到执行到出现重复那条数据,然后出现如上图一样的报错,并停止执行数据导入.

那么遇到以上问题,想要丝滑导入不重复的数据,且不会因为个别数据重复,影响数据导入中断,应该怎么操作?


2.解决方法:

1.初级方法:

a.insert后面添加ignore

使用ignore当插入的值遇到主键(PRIMARY KEY)或者唯一键(UNIQUE KEY)重复时自动忽略重复的记录行,而且不会影响后面的记录行的插入。

比如我把执行脚本改为如下代码:

INSERT ignore INTO `order` ( `orderNo`, `proId`)VALUES('12345678',1),('12345696',1),('12345886',2),('12345877',2),('32345817',2),('12345827',2),('12345887',2),('12345849',3);

这时候执行这个SQL语句就能丝滑导入数据:从下图执行的结果可以看出,不重复的数据已经完全导入,而且会忽略重复数据,不受重复数据的影响

网络异常,图片无法展示
|
网络异常,图片无法展示
|


2.replace

a.使用replace代替insert

使用replace插入的记录遇到主键或者唯一键重复时会先删除表中已存在的重复记录行再执行插入

代码如下:

replace INTO `order` ( `orderNo`, `proId`)VALUES('12345678',1),('12345696',1),('12345886',2),('12345877',2),('32345817',2),('12345827',2),('12345887',2),('12345849',3);

执行结果如下:

网络异常,图片无法展示
|
网络异常,图片无法展示
|

从执行结果的自增ID就可以看出replace会先删除已有数据再插入


3.使用更新的方式插入已有数据

ON DUPLICATE KEY UPDATE为Mysql特有语法,语句的作用,当insert已经存在的记录时,执行Update

Mysql告诉我们,我们的主键冲突了,我们是不是可以改变一下思路,当插入已存在主键的记录时,将插入操作变为修改:

INSERTINTO `order` (id,orderNo,proId)VALUES(2,'88888',4)ON DUPLICATE KEY UPDATE id =88,orderNo='888888';

执行结果如下:

网络异常,图片无法展示
|
网络异常,图片无法展示
|
网络异常,图片无法展示
|

本来id为2的数据变为88且orderNo更新为888888


VALUES修改

那么问题又来了,有人会说我ON DUPLICATE KEY UPDATE 后面跟的是固定的值,如果我想要分别给不同的记录插入不同的值怎么办呢?

可以将后面的修改条件改为VALUES(orderNo),动态的传入要修改的值,执行以下:

INSERTINTO `order` (id,orderNo,proId)VALUES(3,'808080808',4),(88,'9191919',4)ON DUPLICATE KEY UPDATE orderNo=VALUES(orderNo);

执行结果:

网络异常,图片无法展示
|
网络异常,图片无法展示
|
网络异常,图片无法展示
|

我们成功的为不同id的orderNo修改成了不同的值


3.总结

修改的方法有很多种,包括SET或用REPLACE,ignore,连事务都省了,这些在日常的使用当中已经能够满足导入需求,ON DUPLICATE KEY UPDATE能够让我们便捷的完成重复插入的开发需求,但它是Mysql的特有语法,使用时应多注意主键和插入值是否是我们想要插入或修改的key、Value。前面几种较,ON DUPLICATE KEY UPDATE简单且灵活

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
9天前
|
关系型数据库 MySQL Linux
在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。
本文介绍了在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。同时,文章还对比了编译源码安装与使用 RPM 包安装的优缺点,帮助读者根据需求选择最合适的方法。通过具体案例,展示了编译源码安装的灵活性和定制性。
45 2
|
12天前
|
存储 关系型数据库 MySQL
MySQL vs. PostgreSQL:选择适合你的开源数据库
在众多开源数据库中,MySQL和PostgreSQL无疑是最受欢迎的两个。它们都有着强大的功能、广泛的社区支持和丰富的生态系统。然而,它们在设计理念、性能特点、功能特性等方面存在着显著的差异。本文将从这三个方面对MySQL和PostgreSQL进行比较,以帮助您选择更适合您需求的开源数据库。
53 4
|
7天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
40 0
|
8天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第26天】数据库作为现代应用系统的核心组件,其性能优化至关重要。本文主要探讨MySQL的索引策略与查询性能调优。通过合理创建索引(如B-Tree、复合索引)和优化查询语句(如使用EXPLAIN、优化分页查询),可以显著提升数据库的响应速度和稳定性。实践中还需定期审查慢查询日志,持续优化性能。
35 0
|
26天前
|
存储 SQL 关系型数据库
Mysql学习笔记(二):数据库命令行代码总结
这篇文章是关于MySQL数据库命令行操作的总结,包括登录、退出、查看时间与版本、数据库和数据表的基本操作(如创建、删除、查看)、数据的增删改查等。它还涉及了如何通过SQL语句进行条件查询、模糊查询、范围查询和限制查询,以及如何进行表结构的修改。这些内容对于初学者来说非常实用,是学习MySQL数据库管理的基础。
104 6
|
24天前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
56 3
Mysql(4)—数据库索引
|
26天前
|
SQL Ubuntu 关系型数据库
Mysql学习笔记(一):数据库详细介绍以及Navicat简单使用
本文为MySQL学习笔记,介绍了数据库的基本概念,包括行、列、主键等,并解释了C/S和B/S架构以及SQL语言的分类。接着,指导如何在Windows和Ubuntu系统上安装MySQL,并提供了启动、停止和重启服务的命令。文章还涵盖了Navicat的使用,包括安装、登录和新建表格等步骤。最后,介绍了MySQL中的数据类型和字段约束,如主键、外键、非空和唯一等。
62 3
Mysql学习笔记(一):数据库详细介绍以及Navicat简单使用
|
1月前
|
缓存 算法 关系型数据库
Mysql(3)—数据库相关概念及工作原理
数据库是一个以某种有组织的方式存储的数据集合。它通常包括一个或多个不同的主题领域或用途的数据表。
46 5
Mysql(3)—数据库相关概念及工作原理
|
18天前
|
存储 关系型数据库 MySQL
如何在MySQL中创建数据库?
【10月更文挑战第16天】如何在MySQL中创建数据库?
|
22天前
|
SQL Oracle 关系型数据库
安装最新 MySQL 8.0 数据库(教学用)
安装最新 MySQL 8.0 数据库(教学用)
94 4