开发者社区> 问答> 正文

utf8_general_ci和utf8_unicode_ci有什么区别??mysql

我对Unicode有了两个选择,这些选择对于mysql数据库来说很有希望。

utf8_general_ci unicode (multilingual), case-insensitive utf8_unicode_ci unicode (multilingual), case-insensitive 您能解释一下utf8_general_ci和utf8_unicode_ci有什么区别吗?在设计数据库时,一个选择一个会产生什么影响?

展开
收起
保持可爱mmm 2020-05-17 11:19:35 500 0
1 条回答
写回答
取消 提交回答
  • utf8_general_ci这是一种非常简单的排序规则,在Unicode上很破损,这种排序对普通Unicode文本给出的结果不正确。它的作用是:

    转换为Unicode规范化形式D以进行规范分解 删除任何组合字符 转换为大写 这在Unicode上无法正常工作,因为它不了解Unicode大小写。单独使用Unicode框比处理ASCII格式的方法要复杂得多。例如:

    “ẞ”的小写字母是“ß”,但是“ß”的大写字母是“ SS”。 有两个小写的希腊语西格玛,但只有一个大写的西格玛。考虑“Σίσυφος”。 像“ø”这样的字母不会分解为“ o”加变音符号,这意味着它不会正确排序。 还有许多其他的细微之处。

    utf8_unicode_ci使用标准Unicode排序规则算法,支持所谓的扩展和连字,例如:德语字母ß(U + 00DF LETTER SHARP S)在“ ss”附近排序字母Œ(U + 0152 LATIN CAPITAL LIGATURE OE)在“ OE”附近排序”。 utf8_general_ci 不支持扩展名/连字号,而是将所有这些字母排序为单个字符,有时顺序错误。

    utf8_unicode_ci是一般所有脚本更准确。例如,在西里尔字母上: utf8_unicode_ci适用于所有以下语言:俄语,保加利亚语,白俄罗斯语,马其顿语,塞尔维亚语和乌克兰语。utf8_general_ci仅适用于西里尔文的俄语和保加利亚子集。白俄罗斯语,马其顿语,塞尔维亚语和乌克兰语中使用的多余字母排序不正确。 成本utf8_unicode_ci是,它是一个稍微有点慢utf8_general_ci。但这就是您为正确性付出的代价。您可能会得到一个错误的快速答案,或者是一个稍微慢一些的正确答案。你的选择。永远难以证明给出错误的答案是正确的,因此最好假设它utf8_general_ci不存在并始终使用utf8_unicode_ci。好吧,除非您想要错误的答案。

    资料来源:http : //forums.mysql.com/read.php?103,187048,188748#msg-188748来源:stack overflow

    2020-05-17 11:20:45
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
One Box: 解读事务与分析一体化数据库 HybridDB for MySQL 立即下载
One Box:解读事务与分析一体化数据库HybridDB for MySQL 立即下载
如何支撑HTAP场景-HybridDB for MySQL系统架构和技术演进 立即下载

相关镜像