SQL字符串查询有哪些坑?

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS AI 助手,专业版
简介: 本文通过创建一个包含不同格式姓名数据的表格,探讨了MySQL中字符排序规则(Collation)的影响。通过使用不区分大小写和空格的查询条件,文章演示了如何获取所有插入的记录,并解释了排序规则中"_ci"、"_cs"及"_bin"的区别。此外,还强调了在数据处理过程中,应考虑大小写敏感性和字符串前后空格的问题,以防导致统计或比较上的错误。最后,提供了Go语言中处理这类问题的方法,如使用`strings.EqualFold()`进行不区分大小写的字符串比较,以及使用`strings.TrimSpace()`去除字符串两端的空白字符。

我们创建如下一张表:

sql

代码解读

复制代码

CREATE TABLE `t` (
  `id` bigint(10) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL COMMENT 'name',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci COMMENT='t'

在这张表我们简单的插入三条数据,插入语句如下:

sql

代码解读

复制代码

INSERT INTO t(name) VALUES("serena "); # 插入尾部带有空格的"serena "
INSERT INTO t(name) VALUES("Serena"); # 插入首字母为大写的"Serena"
INSERT INTO t(name) VALUES("serena"); #  插入"serena"

可以看到,在第一条插入语句,我们插入一个值为"serena "的字符串,注意这个字符串尾部是包含空格的。第二条插入语句中,我们插入首字母为大写的"Serena"。第三个插入语句中,我们则插入值为"serena"的记录。

接下来,我们简单的执行如下

sql

代码解读

复制代码

SELECT * FROM t WHERE `name` = 'serena'

查询结果如下:

从查询结果可以看到,该条SQL语句将刚才我们插入的三条数据都查询了出来,看似简单的SQL语句以及明了的查询结果,我们可以得到:

在建表时,我们使用了COLLATE=utf8mb4_general_ci的排序规则,排序规则(Collation)是比较和排序字符串的一种规则,每个字符集都会有默认的排序规则。

排序规则我们可以通过SHOW CHARSET来进行查看:

排序规则_ci结尾表示不区分大小写(Case Insentive),_cs 表示大小写敏感_bin表示通过存储字符的二进制进行比较

需要注意的是,比较MySQL字符串,默认采用不区分大小的排序规则,我们可以通过一个SQL来进行验证:

另外,在字符串查询的时候,默认SQL语句会帮我们去除掉字段的前后空格,但不会去除字符串空间的空格,这个是需要注意的点,因此上述的查询语句能够将第一条加入的数据记录查询出来。

了解到这两个点后,我们回到开头,为什么说有时候这会是一个坑儿,当我们将这些诸如大小写,包含收尾空格的数据查询到内存时,在代码通过一些字符串比较,计数时,可能会因为大小写,收尾空格等原因,导致统计不准确,或者比较不准确的情况产生,从而导致我们有时候可能需要通过日志打印等方式去逐一排查,排查到最后确实简单的一个字符串排序规则的问题所导致。

go中,我们可以通过库函数来对字符串在内存中进行操作,例如:

  • 字符串比较不区分大小写strings.EqualFold()
  • 去除字符串收尾空格strings.TrimSpace()

go

代码解读

复制代码

package main

import (
    "fmt"
    "strings"
)

func main() {
    str1 := "serena"
    str2 := "Serena"
    str3 := "  serena   "

    // 字符串不区分大小写比较
    fmt.Println(strings.EqualFold(str1, str2)) // true

    // 字符串去除收尾空格
    fmt.Println(strings.TrimSpace(str3)) // serena
}

在学习的过程中,时刻需要把控好看似简单的基础知识,有时候也会成为你排查问题时难以想到的一个问题点。



转载来源:https://juejin.cn/post/7388064351503728655

相关文章
|
5月前
|
SQL 监控 关系型数据库
一键开启百倍加速!RDS DuckDB 黑科技让SQL查询速度最高提升200倍
RDS MySQL DuckDB分析实例结合事务处理与实时分析能力,显著提升SQL查询性能,最高可达200倍,兼容MySQL语法,无需额外学习成本。
|
5月前
|
SQL 存储 关系型数据库
MySQL体系结构详解:一条SQL查询的旅程
本文深入解析MySQL内部架构,从SQL查询的执行流程到性能优化技巧,涵盖连接建立、查询处理、执行阶段及存储引擎工作机制,帮助开发者理解MySQL运行原理并提升数据库性能。
|
9月前
|
SQL 数据挖掘 数据库
第三篇:高级 SQL 查询与多表操作
本文深入讲解高级SQL查询技巧,涵盖多表JOIN操作、聚合函数、分组查询、子查询及视图索引等内容。适合已掌握基础SQL的学习者,通过实例解析INNER/LEFT/RIGHT/FULL JOIN用法,以及COUNT/SUM/AVG等聚合函数的应用。同时探讨复杂WHERE条件、子查询嵌套,并介绍视图简化查询与索引优化性能的方法。最后提供实践建议与学习资源,助你提升SQL技能以应对实际数据处理需求。
709 1
|
5月前
|
SQL 监控 关系型数据库
SQL优化技巧:让MySQL查询快人一步
本文深入解析了MySQL查询优化的核心技巧,涵盖索引设计、查询重写、分页优化、批量操作、数据类型优化及性能监控等方面,帮助开发者显著提升数据库性能,解决慢查询问题,适用于高并发与大数据场景。
|
6月前
|
SQL XML Java
通过MyBatis的XML配置实现灵活的动态SQL查询
总结而言,通过MyBatis的XML配置实现灵活的动态SQL查询,可以让开发者以声明式的方式构建SQL语句,既保证了SQL操作的灵活性,又简化了代码的复杂度。这种方式可以显著提高数据库操作的效率和代码的可维护性。
416 18
|
4月前
|
SQL 关系型数据库 MySQL
(SQL)SQL语言中的查询语句整理
查询语句在sql中占了挺大一部分篇幅,因为在数据库中使用查询语句的次数远多于更新与删除命令。而查询语句比起其他语句要更加的复杂,可因为sql是数据库不可或缺的一部分,所以即使不懂,也必须得弄懂,以上。
320 0
|
11月前
|
SQL 运维 监控
SQL查询太慢?实战讲解YashanDB SQL调优思路
本文是Meetup第十期“调优实战专场”的第二篇技术文章,上一篇《高效查询秘诀,解码YashanDB优化器分组查询优化手段》中,我们揭秘了YashanDB分组查询优化秘诀,本文将通过一个案例,助你快速上手YashanDB慢日志功能,精准定位“慢SQL”后进行优化。
|
10月前
|
SQL Java 数据库连接
MyBatis动态SQL字符串空值判断,这个细节99%的程序员都踩过坑!
本文深入探讨了MyBatis动态SQL中字符串参数判空的常见问题。通过具体案例分析,对比了`name != null and name != ''`与`name != null and name != ' '`两种写法的差异,指出后者可能引发逻辑混乱。为避免此类问题,建议在后端对参数进行预处理(如trim去空格),简化MyBatis判断逻辑,提升代码健壮性与可维护性。细节决定成败,严谨处理参数判空是写出高质量代码的关键。
1392 0
|
11月前
|
SQL 索引
【YashanDB知识库】字段加上索引后,SQL查询不到结果
【YashanDB知识库】字段加上索引后,SQL查询不到结果
|
6月前
|
SQL 人工智能 数据库
【三桥君】如何正确使用SQL查询语句:避免常见错误?
三桥君解析了SQL查询中的常见错误和正确用法。AI产品专家三桥君通过三个典型案例:1)属性重复比较错误,应使用IN而非AND;2)WHERE子句中非法使用聚合函数的错误,应改用HAVING;3)正确的分组查询示例。三桥君还介绍了学生、课程和选课三个关系模式,并分析了SQL查询中的属性比较、聚合函数使用和分组查询等关键概念。最后通过实战练习帮助读者巩固知识,强调掌握这些技巧对提升数据库查询效率的重要性。
221 0