utf8_general_ci和utf8_unicode_ci有什么区别？?mysql

utf8_general_ci这是一种非常简单的排序规则，在Unicode上很破损，这种排序对普通Unicode文本给出的结果不正确。它的作用是：

转换为Unicode规范化形式D以进行规范分解删除任何组合字符转换为大写这在Unicode上无法正常工作，因为它不了解Unicode大小写。单独使用Unicode框比处理ASCII格式的方法要复杂得多。例如：

“ẞ”的小写字母是“ß”，但是“ß”的大写字母是“ SS”。有两个小写的希腊语西格玛，但只有一个大写的西格玛。考虑“Σίσυφος”。像“ø”这样的字母不会分解为“ o”加变音符号，这意味着它不会正确排序。还有许多其他的细微之处。

utf8_unicode_ci使用标准Unicode排序规则算法，支持所谓的扩展和连字，例如：德语字母ß（U + 00DF LETTER SHARP S）在“ ss”附近排序字母Œ（U + 0152 LATIN CAPITAL LIGATURE OE）在“ OE”附近排序”。 utf8_general_ci 不支持扩展名/连字号，而是将所有这些字母排序为单个字符，有时顺序错误。

utf8_unicode_ci是一般所有脚本更准确。例如，在西里尔字母上： utf8_unicode_ci适用于所有以下语言：俄语，保加利亚语，白俄罗斯语，马其顿语，塞尔维亚语和乌克兰语。utf8_general_ci仅适用于西里尔文的俄语和保加利亚子集。白俄罗斯语，马其顿语，塞尔维亚语和乌克兰语中使用的多余字母排序不正确。成本utf8_unicode_ci是，它是一个稍微有点慢utf8_general_ci。但这就是您为正确性付出的代价。您可能会得到一个错误的快速答案，或者是一个稍微慢一些的正确答案。你的选择。永远难以证明给出错误的答案是正确的，因此最好假设它utf8_general_ci不存在并始终使用utf8_unicode_ci。好吧，除非您想要错误的答案。

资料来源：http : //forums.mysql.com/read.php?103,187048,188748#msg-188748来源：stack overflow

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

utf8_general_ci和utf8_unicode_ci有什么区别？?mysql

相关文章