【MySQL进阶之路丨第十四篇】一文带你精通MySQL重复数据及SQL注入

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 【MySQL进阶之路丨第十四篇】一文带你精通MySQL重复数据及SQL注入



MySQL重复数据

MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在并进行处理,有时候我们也需要删除这些重复的数据。

防止重复数据的出现

1.使用主键或唯一约束:在创建表时,为某个列或多个列设置主键或唯一约束。这样,在插入数据时,如果存在重复的值,将会引发错误,从而阻止插入。

2.使用INSERT IGNORE语句:使用INSERT IGNORE语句插入数据时,如果有重复的值出现,在插入时会被忽略,不会引发错误,从而避免重复数据的插入。

过滤重复数据

我们可以使用DISTINCT关键字来查询表中的唯一记录。例如,SELECT DISTINCT * FROM 表名; 将会返回表中的唯一记录,去除了重复数据。

假设我们有一个名为"1—tbl"的表,包含id(主键),title等列。

过滤语句如下:

SELECT DISTINCT title,author FROM 1—tbl;

结果如下所示:

删除重复数据

我们可以先创建一个新表,将旧表中的重复数据删除后复制给新表,再将新表命名为旧表名称。

模板如下:

CREATE TABLE 新表 SELECT 列1,列2 FROM 旧表  GROUP BY (列1, 列2);
DROP TABLE 旧表;
ALTER TABLE 新表 RENAME TO 旧表名;

假设我们有一个名为"1—tbl"的表,包含id(主键),title等列。

现在我们想要删除author列中的重复值,只保留一条记录,语句如下:

CREATE TABLE qiu SELECT author From 1—tbl  GROUP BY (author);
DROP TABLE 1—tbl;
ALTER TABLE qiu RENAME TO 1—tbl;

结果如下所示:

统计重复数据

使用GROUP BY子句与聚合函数(如COUNT)可以对表中的重复数据进行统计。例如,SELECT 列名, COUNT(*) FROM 表名 GROUP BY 列名 HAVING COUNT(*) > 1; 可以获取重复出现的数据和出现次数。

假设我们有一个名为"1—tbl"的表,包含id(主键),title等列。

现在我们想要统计author列中重复出现的数据以及其出现次数。

SELECT author, COUNT(*) AS count FROM 1—tbl GROUP BY author HAVING COUNT(*) > 1;

结果如下:

MySQL中SQL注入

SQL注入是一种常见的安全漏洞,它发生在应用程序将用户提供的数据直接拼接到SQL查询中,导致攻击者可以执行恶意的SQL语句。

例如,后端SQL查询语句如下:

SELECT * FROM USERS WHERE ID='输入';

当攻击者输入:

1' or 1=1#

后端语句变为:

SELECT * FROM USERS WHERE ID='1' or 1=1#';

而在MySQL中,#后的内容均会被省略

故语句等价于

SELECT * FROM USERS WHERE ID='1' or 1=1

由于1=1恒成立,且条件用or连接,这导致后端返回所有user表的内容。

要防范此类攻击,需要对用户输入的数据进行转义,如# – / or ’ 等等。

读者可通过以下专栏从攻击者的视角学习MySQL的数据安全防护:

1、【Sqli-Labs靶场攻防实战】

2、【sq注入攻击专栏】

总结

以上为 【MySQL进阶之路丨第十四篇】,带领读者掌握 MySQL 重复数据及SQL注入,通过具体实操实现对MySQL数据库的深度理解。

MySQL系列将持续更新,欢迎订阅收藏。


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
12天前
|
SQL 关系型数据库 MySQL
MySQL进阶突击系列(07) 她气鼓鼓递来一条SQL | 怎么看执行计划、SQL怎么优化?
在日常研发工作当中,系统性能优化,从大的方面来看主要涉及基础平台优化、业务系统性能优化、数据库优化。面对数据库优化,除了DBA在集群性能、服务器调优需要投入精力,我们研发需要负责业务SQL执行优化。当业务数据量达到一定规模后,SQL执行效率可能就会出现瓶颈,影响系统业务响应。掌握如何判断SQL执行慢、以及如何分析SQL执行计划、优化SQL的技能,在工作中解决SQL性能问题显得非常关键。
|
12天前
|
SQL 存储 关系型数据库
MySQL原理简介—1.SQL的执行流程
本文介绍了MySQL驱动、数据库连接池及SQL执行流程的关键组件和作用。主要内容包括:MySQL驱动用于建立Java系统与数据库的网络连接;数据库连接池提高多线程并发访问效率;MySQL中的连接池维护多个数据库连接并进行权限验证;网络连接由线程处理,监听请求并读取数据;SQL接口负责执行SQL语句;查询解析器将SQL语句解析为可执行逻辑;查询优化器选择最优查询路径;存储引擎接口负责实际的数据操作;执行器根据优化后的执行计划调用存储引擎接口完成SQL语句的执行。整个流程确保了高效、安全地处理SQL请求。
134 75
|
13天前
|
Java 关系型数据库 MySQL
SpringBoot 通过集成 Flink CDC 来实时追踪 MySql 数据变动
通过详细的步骤和示例代码,您可以在 SpringBoot 项目中成功集成 Flink CDC,并实时追踪 MySQL 数据库的变动。
106 43
|
5天前
|
存储 SQL 关系型数据库
MySQL底层概述—4.InnoDB数据文件
本文介绍了InnoDB表空间文件结构及其组成部分,包括表空间、段、区、页和行。表空间是最高逻辑层,包含多个段;段由若干个区组成,每个区包含64个连续的页,页用于存储多条行记录。文章还详细解析了Page结构,分为通用部分(文件头与文件尾)、数据记录部分和页目录部分。此外,文中探讨了行记录格式,包括四种行格式(Redundant、Compact、Dynamic和Compressed),重点介绍了Compact行记录格式及其溢出机制。最后,文章解释了不同行格式的特点及应用场景,帮助理解InnoDB存储引擎的工作原理。
MySQL底层概述—4.InnoDB数据文件
|
7天前
|
SQL 存储 关系型数据库
MySQL原理简介—10.SQL语句和执行计划
本文介绍了MySQL执行计划的相关概念及其优化方法。首先解释了什么是执行计划,它是SQL语句在查询时如何检索、筛选和排序数据的过程。接着详细描述了执行计划中常见的访问类型,如const、ref、range、index和all等,并分析了它们的性能特点。文中还探讨了多表关联查询的原理及优化策略,包括驱动表和被驱动表的选择。此外,文章讨论了全表扫描和索引的成本计算方法,以及MySQL如何通过成本估算选择最优执行计划。最后,介绍了explain命令的各个参数含义,帮助理解查询优化器的工作机制。通过这些内容,读者可以更好地理解和优化SQL查询性能。
|
2月前
|
SQL 存储 关系型数据库
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
本文详细介绍了MySQL中的SQL语法,包括数据定义(DDL)、数据操作(DML)、数据查询(DQL)和数据控制(DCL)四个主要部分。内容涵盖了创建、修改和删除数据库、表以及表字段的操作,以及通过图形化工具DataGrip进行数据库管理和查询。此外,还讲解了数据的增、删、改、查操作,以及查询语句的条件、聚合函数、分组、排序和分页等知识点。
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
|
2月前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
175 6
|
2月前
|
SQL 存储 缓存
MySQL进阶突击系列(02)一条更新SQL执行过程 | 讲透undoLog、redoLog、binLog日志三宝
本文详细介绍了MySQL中update SQL执行过程涉及的undoLog、redoLog和binLog三种日志的作用及其工作原理,包括它们如何确保数据的一致性和完整性,以及在事务提交过程中各自的角色。同时,文章还探讨了这些日志在故障恢复中的重要性,强调了合理配置相关参数对于提高系统稳定性的必要性。
|
2月前
|
SQL 关系型数据库 MySQL
MySQL 高级(进阶) SQL 语句
MySQL 提供了丰富的高级 SQL 语句功能,能够处理复杂的数据查询和管理需求。通过掌握窗口函数、子查询、联合查询、复杂连接操作和事务处理等高级技术,能够大幅提升数据库操作的效率和灵活性。在实际应用中,合理使用这些高级功能,可以更高效地管理和查询数据,满足多样化的业务需求。
308 3
|
2月前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。