utf8mb4_unicode_ci校对规则的_ci是什么意思?底层原理是什么?

简介: utf8mb4_unicode_ci校对规则的_ci是什么意思?底层原理是什么?

在MySQL中,校对规则(Collation)是一种用于比较和排序字符集的算法,用于确定字符串的排序顺序以及在执行各种字符串比较时如何比较字符串的规则。_ci是校对规则的一个后缀,表示在比较字符串时要忽略大小写。

在utf8mb4_unicode_ci校对规则中,_ci表示它是大小写不敏感的。底层原理是它使用了Unicode Collation Algorithm(UCA)来进行排序和比较,该算法将字符映射到Unicode标准中的对应位置,并对字符进行比较,然后根据字符的权重排序。对于_ci后缀,UCA将使用一种称为基本级别的比较方法,其中字母大小写被视为相等,因此会忽略大小写进行比较。

相关文章
|
10月前
|
存储 数据库
编码集的作用是什么?常见的编码集有什么?为什么常用utf-8?
编码集的作用是什么?常见的编码集有什么?为什么常用utf-8?
59 0
|
28天前
|
自然语言处理 Unix Linux
字符编码问题之UTF-16和UCS-2的关系如何解决
字符编码问题之UTF-16和UCS-2的关系如何解决
41 1
|
4月前
|
存储 自然语言处理 关系型数据库
👨‍💻如何使用MySQL存储Emoji表情,UTF-8和UTF-8MB4字符编码有何区别?
👨‍💻如何使用MySQL存储Emoji表情,UTF-8和UTF-8MB4字符编码有何区别?
147 1
|
12月前
|
关系型数据库 MySQL OceanBase
utf8mb4_unicode_ci
utf8mb4_unicode_ci
159 2
|
存储 Java 关系型数据库
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
【精炼易懂】字符集、编码、乱码问题、ASCII、GBK、Unicode、UTF-8详解+实例说明
5559 4
|
存储 Windows
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
114 0
|
关系型数据库 MySQL
MySQL的校对规则设置为 utf8mb4_unicode_ci是干什么的?底层原理是什么?
MySQL的校对规则设置为 utf8mb4_unicode_ci是干什么的?底层原理是什么?
172 0
|
存储 关系型数据库 MySQL
DataX:导入4字节UTF8编码(生僻字)到Mysql数据库的utf8mb4数据表
MySql数据库的编码支持UFT8字符集。utf-8编码可能是2个字节、3个字节、4个字节的字符,MYSQL的utf-8编码,只支持3个字节的字符。汉字中很多生僻字都是4个字节的字符,日常生活中人的姓名就会有很多高位的生僻字。
5825 0
|
存储 关系型数据库 MySQL
utf8编码和utf8mb4编码(其它编码简介)
utf8编码和utf8mb4编码(其它编码简介)
352 0