mysql中utf8、utf8mb4和utf8mb4_unicode_ci、utf8mb4_general_ci

本文涉及的产品
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: mysql中utf8、utf8mb4和utf8mb4_unicode_ci、utf8mb4_general_ci

1. utf8、utf8mb4(utf8 most bytes 4)

utf8mb4 是 utf8 的超集,能够用四个字节存储更多的字符。

在MySQL5.5.3之后 增加了 utfmb4 字符集

支持BMP(Basic Multilingual Plane,基本多文种平面)和补充字符

最多使用四个字节存储字符

标准的UTF-8字符集编码是可以使用1-4个字节去编码21位字符,这几乎包含了世界上所有能看见的语言。

**MySQL里面实现的utf8最长使用3个字符,**包含了大多数字符但并不是所有。例如 emoji 和一些不常用的汉字,如“墅”,这些需要四个字节才能编码的就不支持。

2. utf8mb4_unicode_ci、utf8mb4_general_ci

总的来说,utf8mb4_unicode_ci 排序准确高,utf8mb4_general_ci 排序快

utf8mb4 对应的排序字符集有utf8mb4_unicode_ci、utf8mb4_general_ci,

utf8mb4_unicode_ci 是基于标准的 Unicode 来排序和比较的,能够在各种语言中精确排序。

准确性:

utf8mb4_unicode_ci是基于标准的Unicode来排序和比较,能够在各种语言之间精确排序

utf8mb4_general_ci没有实现Unicode排序规则,在遇到某些特殊语言或者字符集,排序结果可能不一致。

但是,在绝大多数情况下,这些特殊字符的顺序并不需要那么精确。

性能

utf8mb4_general_ci在比较和排序的时候更快

utf8mb4_unicode_ci在特殊情况下,Unicode排序规则为了能够处理特殊字符的情况,实现了略微复杂的排序算法。

但是在绝大多数情况下发,不会发生此类复杂比较。相比选择哪一种collation,使用者更应该关心字符集与排序规则在db里需要统一。

新建数据库时选择:

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
存储 关系型数据库 MySQL
Mysql中utf8和utf8mb4区别
Mysql中utf8和utf8mb4区别
59 0
|
2月前
|
存储 关系型数据库 MySQL
为什么不建议在MySQL中使用 utf8?
MySQL 字符编码集中有两套 UTF-8 编码实现:utf8 和 utf8mb4。 如果使用 utf8 的话,存储 emoji 符号和一些比较复杂的汉字、繁体字就会出错。
|
11月前
|
关系型数据库 MySQL Linux
mysql 8中utf8和utf8mb4运行时的编码警告提醒[Warning]——my.ini配置问题
mysql 8中utf8和utf8mb4运行时的编码警告提醒[Warning]——my.ini配置问题
|
11月前
|
存储 关系型数据库 MySQL
Mysql中utf8和utf8mb4区别
Mysql中utf8和utf8mb4区别
90 0
|
SQL 存储 数据可视化
【解决方案 二】---设置mysql5.7编码集为utf8mb4
【解决方案 二】---设置mysql5.7编码集为utf8mb4
407 0
|
关系型数据库 MySQL
MySQL 8 默认字符集改成utf8mb4
MySQL 8 默认字符集改成utf8mb4
154 0
|
SQL 存储 关系型数据库
【MySQL】init_connect='SET NAMES utf8',是干什么的?底层原理是什么?
【MySQL】init_connect='SET NAMES utf8',是干什么的?底层原理是什么?
621 0
|
存储 关系型数据库 MySQL
【MySQL】character-set-server=utf8,是干什么的?底层原理是什么?
【MySQL】character-set-server=utf8,是干什么的?底层原理是什么?
441 0
|
4天前
|
XML Java 关系型数据库
Action:Consider the following: If you want an embedde ,springBoot配置数据库,补全springBoot的xml和mysql配置信息就好了
Action:Consider the following: If you want an embedde ,springBoot配置数据库,补全springBoot的xml和mysql配置信息就好了
|
3天前
|
关系型数据库 MySQL 数据库
关系型数据库mysql数据增量恢复
【7月更文挑战第3天】
13 2