【BUG记录】Cause: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x90\xA6' for column 'name' at row 1

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: 在MySQL中遇到`Incorrect string value`错误通常是因为尝试插入的字符串包含不被数据库字符集支持的字符,如表情符号。错误根源是MySQL默认的utf8不支持4字节的UTF-8字符(如Emoji)。

大家好呀,我是summo,这次的文章标题是一个Mysql数据库的SQL错误,遇到的同学自然懂,没遇到的同学希望你永远也不要遇到。

一、错误说明

Cause: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x90\xA6' for column 'name' at row 1这个错误通常是由于数据库列的字符集设置不支持某些特殊字符(例如表情符号),导致在插入或更新数据时失败。根源就是MySQL使用的是utf8编码,utf8编码默认每个字符3个字节,而Emoji表情使用的Unicode编码占4个字节,所以写入数据库的时候会写入失败并报错。

二、错误分析

1. 分析表的字符集

有设计表结构经验的同学应该都知道MySQL的存储引擎,如InnoDB和MyISAM,但表的字符集不知道大家清不清楚。简单来说表的字符集(Character Set)决定了表中可以存储的字符类型及其编码方式。最适合存储表情符号的字符集是utf8mb4,所以遇到这个错误时首先检查一下错误表的字符集。

(1)查看 MySQL 的系统变量,以确认 MySQL 实例的默认字符集

SHOW VARIABLES LIKE 'character_set%';

image.png

(2)查看表的创建语句,从中可以看到表和列的字符集设置信息

SHOW CREATE TABLE sample_table;

image.png

如果检查后数据库字符集和表字符集都是utf8mb4,但是添加表情符号还是失败的话,那么跟数据库就没有关系了。

2. 确认数据库连接配置是否支持utf8mb4

这一步也简单,就是确认spring.datasource.url中是否也包含 utf8mb4配置,如果没有的话,就加上useUnicode=true&characterEncoding=utf8mb4,如:

spring.datasource.url=jdbc:mysql://localhost:3306/your_database_name?useUnicode=true&characterEncoding=utf8mb4

网上搜索的文章大部分都是这两个解决思路,有些甚至会让你去看MySQL的配置,修改后重新启动MySQL,但最终可能却并不能解决这个问题。如果你确定字符集是对的,数据库连接配置也是对的,但报错还是存在,那么就在执行SQL之前执行一次set names utf8mb4语句。

3. set names utf8mb4怎么加?

(1)没有使用连接池

如果你没有使用连接池,那么在调用SQL之前,需要手动执行一次set names utf8mb4语句,如下:

conn = DriverManager.getConnection(url, user, password);
stmt = conn.createStatement();
stmt.execute("SET NAMES utf8mb4");

(2)Druid连接池

使用Druid连接池的话,那么可以直接加一行配置就行了,如下:

spring.datasource.druid.connection-init-sqls=set names utf8mb4

(3)Hikari连接池

同Druid连接池,加一行配置就行了,如下:

spring.datasource.hikari.connection-init-sql=SET NAMES utf8mb4

其他连接池我就不列举了,大同小异。

三、原理解释

set names utf8mb4 通过确保客户端、连接和服务器之间的数据传输在同一字符集下进行,从根本上避免了字符集不匹配的问题,所以执行该命令能够解决你插入表情符号时报错的问题。

当你执行 set names utf8mb4 语句时,它实际上做了以下几件事情:

  • 设置客户端字符集:
    使MySQL客户端的字符集为utf8mb4,这意味着客户端(也就是你的应用程序)发送给MySQL服务器的数据将被解释为utf8mb4格式。

  • 设置连接字符集:
    使数据库连接层(也叫连接字符集)的编码为utf8mb4。这保证了当数据在客户端和服务器之间传输时,被正确地编码和处理。

  • 设置结果字符集:
    使MySQL服务器返回给客户端的查询结果(比如SELECT语句的结果)都使用utf8mb4编码。

四、小结一下

最初,我的记录方式更偏向简单的笔记,后来发现笔记太乱,为了提高查阅效率,我开始给每个部分加上标题和段落,这样它们就演变成了短文。随着时间的推移,我逐渐增加了内容的层次,加入了前因、详细的分析过程以及小结,这些改进使我的记录更加完善,最终变成了结构化的文章。

不过,在文章标题的选择上,我有些犹豫。尽管起一个吸引人的标题能让文章更有吸引力,但如果将来遇到类似的问题时,因为标题花哨、不明确而导致找不到解决方案,那就得不偿失了。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
目录
相关文章
|
10月前
|
JSON Java 关系型数据库
Java更新数据库报错:Data truncation: Cannot create a JSON value from a string with CHARACTER SET 'binary'.
在Java中,使用mybatis-plus更新实体类对象到mysql,其中一个字段对应数据库中json数据类型,更新时报错:Data truncation: Cannot create a JSON value from a string with CHARACTER SET 'binary'.
1064 4
Java更新数据库报错:Data truncation: Cannot create a JSON value from a string with CHARACTER SET 'binary'.
|
数据安全/隐私保护
作用域通信对象:session用户在登录时通过`void setAttribute(String name,Object value)`方法设置用户名和密码。点击登录按钮后,跳转到另外一个页面显示用户
该博客文章通过示例演示了如何使用session对象的`setAttribute`和`getAttribute`方法在不同页面间传递和显示用户的用户名和密码信息,并说明了如何设置会话的有效期。
作用域通信对象:session用户在登录时通过`void setAttribute(String name,Object value)`方法设置用户名和密码。点击登录按钮后,跳转到另外一个页面显示用户
|
存储 Java
构造String问题之在JDK 9及更高版本中,直接访问String对象的coder和value属性,如何实现
构造String问题之在JDK 9及更高版本中,直接访问String对象的coder和value属性,如何实现
125 0
|
12月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
411 13
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
266 9
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
169 6
|
存储 SQL C++
对比 SQL Server中的VARCHAR(max) 与VARCHAR(n) 数据类型
【7月更文挑战7天】SQL Server 中的 VARCHAR(max) vs VARCHAR(n): - VARCHAR(n) 存储最多 n 个字符(1-8000),适合短文本。 - VARCHAR(max) 可存储约 21 亿个字符,适合大量文本。 - VARCHAR(n) 在处理小数据时性能更好,空间固定。 - VARCHAR(max) 对于大文本更合适,但可能影响性能。 - 选择取决于数据长度预期和业务需求。
1003 1
|
SQL Oracle 关系型数据库
MySQL、SQL Server和Oracle数据库安装部署教程
数据库的安装部署教程因不同的数据库管理系统(DBMS)而异,以下将以MySQL、SQL Server和Oracle为例,分别概述其安装部署的基本步骤。请注意,由于软件版本和操作系统的不同,具体步骤可能会有所变化。
1056 3
|
SQL 存储 安全
数据库数据恢复—SQL Server数据库出现逻辑错误的数据恢复案例
SQL Server数据库数据恢复环境: 某品牌服务器存储中有两组raid5磁盘阵列。操作系统层面跑着SQL Server数据库,SQL Server数据库存放在D盘分区中。 SQL Server数据库故障: 存放SQL Server数据库的D盘分区容量不足,管理员在E盘中生成了一个.ndf的文件并且将数据库路径指向E盘继续使用。数据库继续运行一段时间后出现故障并报错,连接失效,SqlServer数据库无法附加查询。管理员多次尝试恢复数据库数据但是没有成功。