👨‍💻如何使用MySQL存储Emoji表情，UTF-8和UTF-8MB4字符编码有何区别？-阿里云开发者社区

👨‍💻如何使用MySQL存储Emoji表情，UTF-8和UTF-8MB4字符编码有何区别？

2024-01-05 881

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL DuckDB 分析主实例，基础系列 4核8GB

RDS DuckDB + QuickBI 企业套餐，8核32GB + QuickBI 专业版

RDS MySQL DuckDB 分析主实例，集群系列 4核8GB

简介： 👨‍💻如何使用MySQL存储Emoji表情，UTF-8和UTF-8MB4字符编码有何区别？

终于开始动工这最后一篇小知识的文章啦。

一直都没想到写什么比较合适，就要继续准备肝11月的更文了，太卷了吧👨‍💻

🏆前言

这篇应该算个小知识吧。平时习惯在写文章的时候都喜欢用 windows的emoji表情(win+.)即可弹出，就如👨‍💻🏂🛌🛀🤽‍♂️⛹️‍♂️🤸‍♂️，还有、🏎🚠🛫💺🚀🛰⛵，这种🍟🍔🍿🌭🥞🥙🍰🥤🍸

之前开发的项目，没有存储过这种小表情，都是使用mysql的默认字符设置UTF-8,但是今天测试发现是行不通，从而就有了这篇小文章啦，希望能够让你有所收获。

📚一、UTF-8 为什么不支持Emoji表情

在一个utf-8表中所做测试，不支持插入数据中包含emoji表情的数据。

原因：MySQL数据库的 “utf8”并不是真正概念里的 UTF-8。目前可见字符集都只需要3个字节，包含了所有字符。但是问题出在unicode6系列编码上，它们需要4个字节，这部分就是有名的emoji。所以，如果我们的数据库使用默认字符设置，是无法存储emoji表情的。

📑二、UTF-8 与 UTF-8MB4 的区别

2.1、UTF-8 （Unicode）

我们先谈谈UTF-8,最早只有127个字符被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，但是要处理中文显然一个字节是不够的，至少需要两个字节，而且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，用来把中文编进去。你可以想得到的是，全世界有上百种语言，日本把日文编到Shift_JIS里，韩国把韩文编到Euc-kr里，各国有各国的标准，就会不可避免地出现冲突，结果就是，在多语言混合的文本中，显示出来会有乱码。

因此，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。现代操作系统和大多数编程语言都直接支持Unicode。

所以在UTF-8编码中，一个英文字符占用一个字节的存储空间，一个中文（含繁体）占用三个字节的存储空间。

目前基本上可见字符集都只需要三个字节，包含了所有字符，但是目前问题出在了unicode6系列编码上，它们需要4个字节，这部分就是有名的emoji。所以，你只要不是特种编码还是unicode，且不存emoji，保证不出问题。

另外在此处，我有一点需要补充的是：

MySQL数据库的 “utf8”并不是真正概念里的 UTF-8，原因上面是一点，还有一点是MySQL中的“utf8”编码只支持最大3字节每字符。真正的大家正在使用的UTF-8编码是应该能支持4字节每个字符。

但其实MYSQL的开发者，并没有修饰这个bug，而是推出了新的字符集，就是UTF-8MB4字符编码。👇

2.2、UTF-8MB4

UTF8MB4：MySQL在5.5.3之后增加了utf8mb4的编码，mb4就是most bytes 4的意思，专门用来兼容四字节的unicode。因此可以用来存储emoji表情。

从8.0后，MySQL也将会在某个版本中开始使用UTF-8MB4作为默认的字符编码。

所以简单说即是：UTF-8MB4才是MySQL中真正的UTF-8编码。

那么如何让MySQL存储Emoji表情勒。

📰三、如何让MySQL存储Emoji表情

我们在创建数据库的时候，就需要选定utf-8mb4字符集，而不是utf-8。

我们在设置字段字符集的时候，也需要设置为utf-8mb4字符集。

这样我在Navicat 中测试是可以的。

但是，我之前在网上查询相关资料的时候，说是需要修改一下my.ini配置文件，

在[mysqld]下面添加：character_set_server=utf8mb4，保存，重启mysql，应该就可以解决了。

⌛四、自言自语

注意：下次再有人问起设置什么样的编码，记得直接推荐设置utf-8mb4哦，这个才是MySQL真正的UTF-8编码哦。

开始想11月更文写什么，掘金大佬们，你说我现在开始学前端还有救吗。

大家也可以说说想看什么，我会就写写会，不会就去学学，给大家推推文。👨‍💻

咱们后端这阶段真的是处于一个是人是鬼都在卷的时期，困难重重啊。

👨‍💻如何使用MySQL存储Emoji表情，UTF-8和UTF-8MB4字符编码有何区别？

🏆前言

📚一、UTF-8 为什么不支持Emoji表情

📑二、UTF-8 与 UTF-8MB4 的区别

2.1、UTF-8 （Unicode）

2.2、UTF-8MB4

📰三、如何让MySQL存储Emoji表情

⌛四、自言自语

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

👨‍💻如何使用MySQL存储Emoji表情，UTF-8和UTF-8MB4字符编码有何区别？

🏆前言

📚一、UTF-8 为什么不支持Emoji表情

📑二、UTF-8 与 UTF-8MB4 的区别

2.1、UTF-8 （Unicode）

2.2、UTF-8MB4

📰三、如何让MySQL存储Emoji表情

⌛四、自言自语

热门文章

最新文章

相关课程

相关电子书

推荐镜像