mysql字符串等值查询中条件字段值末尾有空格也能查到数据问题

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: mysql字符串等值查询中条件字段值末尾有空格也能查到数据问题

一、事故还原

我们仍然使用学生信息表,但是我们只需要保留两个字段即可:

CREATE TABLE `student_info` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '学号',
  `name` varchar(20) CHARACTER SET utf8 DEFAULT NULL COMMENT '姓名',  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='学生基本信息表';

先插入三条数据备用:

#尾部无空格
INSERT INTO `student_info` (`name`) VALUES ('duduu');
#尾部带一个空格
INSERT INTO `student_info` (`name`) VALUES ('duduu ');
#尾部带两个空格
INSERT INTO `student_info` (`name`) VALUES ('duduu  ');

需要注意的是,name字段值分别是:不带空格的duduu、带一个空格的duduu、带两个空格的duduu,且空格都是加在了尾部。我们查询这几条记录的name字段的长度:

mysql> select length(name) from student_info;
+--------------+
| length(name) |
+--------------+
|            5 |
|            6 |
|            7 |
+--------------+
3 rows in set (0.00 sec)

这个结果是符合预期的,MySQL检索CHAR类型的数据时,CHAR类型的字段会去除尾部的空格;检索VARCHAR类型的字段数据时,会保留数据尾部的空格,因此这里的长度分别是5、6、7。我们针对name做简单的等值查询试试:

#不带空格的duduu
mysql> select * from student_info where name='duduu';
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 | duduu   |
|  3 | duduu   |
+----+---------+
3 rows in set (0.00 sec)
#带一个空格
mysql> select * from student_info where name='duduu ';
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 | duduu   |
|  3 | duduu   |
+----+---------+
3 rows in set (0.00 sec)
#带两个空格
mysql> select * from student_info where name='duduu  ';
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 | duduu   |
|  3 | duduu   |
+----+---------+
3 rows in set (0.00 sec)

我们会发现,无论后面带多少空格,我们始终可以把所有的用户信息都查询出来,这个并不符合我们的预期啊!!!如果我们将空格都放在最前面呢?会发生什么事情?我们来试试。删除表数据后,重新插入数据:

#前面无空格
INSERT INTO `student_info` (`name`) VALUES ('duduu');
#前面带一个空格
INSERT INTO `student_info` (`name`) VALUES (' duduu');
#前面带两个空格
INSERT INTO `student_info` (`name`) VALUES ('  duduu');
此时分别计算字段字符长度:
mysql> select * from student_info; 
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 |  duduu  |
|  3 |   duduu |
+----+---------+
3 rows in set (0.00 sec)
mysql> select length(name) from student_info;
+--------------+
| length(name) |
+--------------+
|            5 |
|            6 |
|            7 |
+--------------+
3 rows in set (0.00 sec)

可以看到空格放在前面和放在后面的查询结果是不一样的,这个倒不是我们关注的重点,我们关注等值查询是否可以正常查询出来:

#不带空格的duduu
mysql> select * from student_info where name='duduu';
+----+-------+
| id | name  |
+----+-------+
|  1 | duduu |
+----+-------+
1 row in set (0.00 sec)
#带一个空格
mysql> select * from student_info where name=' duduu';
+----+--------+
| id | name   |
+----+--------+
|  2 |  duduu |
+----+--------+
1 row in set (0.00 sec)
#带两个空格
mysql> select * from student_info where name='  duduu';
+----+---------+
| id | name    |
+----+---------+
|  3 |   duduu |
+----+---------+
1 row in set (0.00 sec)

通过实验发现,当空格放在前面时,等值查询是没有问题的,但是空格放在后面时,等值查询并不符合我们的预期。

二、合理推测

通过上面的实验,明明是三个长度不同的字符串,空格放在前边被认为是不同,放在后边又被认为是相同,难道说:对于MySQL来说,字符串做字符串等值判断时会忽略后面的空格,duduu(不带空格)、duduu(后面带一个空格)、duduu(后面带两个空格),都被认作是不带空格的duduu了吗?既然MySQL认为这三个字符串是一个,那么我们看看给name增加唯一索引时,插入这几条数据会不会报错。我们索性重新准备学生信息表:

CREATE TABLE `student_info` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '学号',
  `name` varchar(20) CHARACTER SET utf8 DEFAULT NULL COMMENT '姓名',
  UNIQUE KEY uk_name (name),
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='学生基本信息表';

此时插入数据:

mysql> #尾部无空格
mysql> INSERT INTO `student_info` (`name`) VALUES ('duduu');
Query OK, 1 row affected (0.00 sec)
mysql> #尾部带一个空格
mysql> INSERT INTO `student_info` (`name`) VALUES ('duduu ');
ERROR 1062 (23000): Duplicate entry 'duduu ' for key 'uk_name'
mysql> #尾部带两个空格
mysql> INSERT INTO `student_info` (`name`) VALUES ('duduu  ');
ERROR 1062 (23000): Duplicate entry 'duduu  ' for key 'uk_name'

不出所料,进行字符串等值判断时,MySQl认为duduu(不带空格)、duduu(后面带一个空格)、duduu(后面带两个空格)是重复的三个字符串,后面两条数据由于违背了唯一性,因而不可以被插入,我们去官方文档看看有没有提及这一点。

三、权威文档

官方文档链接:https://dev.mysql.com/doc/refman/5.7/en/char.html有提到这样的描述:

MySQL的校对规则基于PAD SPACE,这就意味着CHAR、VARCHAR、TEXT等字符串的等值比较(“=”)会忽略掉尾部的空格。但是这个规则不包括LIKE这样的模糊查询语句。图中代码示例说明的是使用=这样的等值查询时会自动忽略后面的空格,'Jones'和'Jones '都可以被查询到,但是Like需要精准匹配上空格才行。

四、解决思路

既然=查询会自动忽略后面的空格,如何解决呢?下面有两个思路。

🧷思路一:LIKE

如上所提到,官方文档给出了一个思路,即使用like。LIKE是基于逐个字符进行比较的,这样就不会忽略尾部的空格,官方文档有所提及:https://dev.mysql.com/doc/refman/5.7/en/string-comparison-functions.html

我们来实验下:

#不带空格的duduu
mysql> select * from student_info where name like 'duduu';
+----+-------+
| id | name  |
+----+-------+
|  1 | duduu |
+----+-------+
1 row in set (0.00 sec)
#带一个空格
mysql> select * from student_info where name like 'duduu ';
+----+--------+
| id | name   |
+----+--------+
|  2 | duduu  |
+----+--------+
1 row in set (0.00 sec)
#带两个空格
mysql> select * from student_info where name like 'duduu  ';
+----+---------+
| id | name    |
+----+---------+
|  3 | duduu   |
+----+---------+
1 row in set (0.00 sec)

这里可以得到两个结论:

  • LIKE后面的字段可以不带通配符;
  • LIKE是基于逐个字符进行比较的,这样就不会忽略尾部的空格

🧷思路二:BINARY

BINARY不是函数,是类型转换运算符,它用来强制它后面的字符串转为二进制字节,再逐个字节比较,也可以理解成精确匹配,官网上面有这样的描述:https://dev.mysql.com/doc/refman/5.7/en/cast-functions.html#operator_binary

可以看到,空格在BINARY转换后并不会被忽略,那么我们再使用BINARY进行等值查询进行验证:

#不带空格的duduu
mysql> select * from student_info where name = BINARY 'duduu';
+----+-------+
| id | name  |
+----+-------+
|  1 | duduu |
+----+-------+
1 row in set (0.00 sec)
#带一个空格
mysql> select * from student_info where name = BINARY 'duduu ';
+----+--------+
| id | name   |
+----+--------+
|  2 | duduu  |
+----+--------+
1 row in set (0.00 sec)
#带两个空格
mysql> select * from student_info where name = BINARY 'duduu  ';
+----+---------+
| id | name    |
+----+---------+
|  3 | duduu   |
+----+---------+
1 row in set (0.00 sec)

可见BINARY也可以解决此问题。

五、总结

本文的结论如下:

  • 在存储时,不会自动截断尾部的空格,会按原值存储;
  • MySQL的CHAR、VARCHAR、TEXT等字符串字段在等值比较("=")时,基于PAD SPACE校对规则,会忽略掉尾部的空格;
  • 如果想要精确查询就不能用等值查询("="),而应改用LIKE或BINARY;


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
216 66
|
21天前
|
存储 Oracle 关系型数据库
索引在手,查询无忧:MySQL索引简介
MySQL 是一款广泛使用的关系型数据库管理系统,在2024年5月的DB-Engines排名中得分1084,仅次于Oracle。本文介绍MySQL索引的工作原理和类型,包括B+Tree、Hash、Full-text索引,以及主键、唯一、普通索引等,帮助开发者优化查询性能。索引类似于图书馆的分类系统,能快速定位数据行,极大提高检索效率。
51 8
|
24天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
66 11
|
27天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
96 6
|
1月前
|
SQL 关系型数据库 MySQL
mysql分页读取数据重复问题
在服务端开发中,与MySQL数据库进行数据交互时,常因数据量大、网络延迟等因素需分页读取数据。文章介绍了使用`limit`和`offset`参数实现分页的方法,并针对分页过程中可能出现的数据重复问题进行了详细分析,提出了利用时间戳或确保排序规则绝对性等解决方案。
|
2月前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
2月前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
在项目中,为了解决Redis与Mysql的数据一致性问题,我们采用了多种策略:对于低一致性要求的数据,不做特别处理;时效性数据通过设置缓存过期时间来减少不一致风险;高一致性但时效性要求不高的数据,利用MQ异步同步确保最终一致性;而对一致性和时效性都有高要求的数据,则采用分布式事务(如Seata TCC模式)来保障。
76 14
|
2月前
|
关系型数据库 MySQL 索引
MySQL的group by与count(), *字段使用问题
正确使用 `GROUP BY`和 `COUNT()`函数是进行数据聚合查询的基础。通过理解它们的用法和常见问题,可以有效避免查询错误和性能问题。无论是在单列分组、多列分组还是结合其他聚合函数的场景中,掌握这些技巧和注意事项都能大大提升数据查询和分析的效率。
240 0
|
18天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
45 3
|
18天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
47 3