做一个简单的如下的连表查询,居然直接提示错误,居然是字符集不一致的问题,本文记录一下mysql的字符集类型,以及下面这个问题的解决方案
select a.id, b.id from tt as a, t2 as b where a.xx = b.xx -- Illegal mix of collations (utf8mb4_unicode_ci,IMPLICIT) and (utf8mb4_general_ci,IMPLICIT) for operation '=' 复制代码
1. 解决方法
先来看上面这个问题的解决方法,最容易想到的就是统一两张表的字符集,要么都是utf8mb4_general_ci
,要么就都是utf8mb4_unicode_ci
,统一一下这个问题就自然解决了
如果我不想修改表的字符集呢?毕竟生产环境下,做这种操作还是有风险的,下面是一种不太优雅的解决方法
- 在字段后面指定字符集(可以全部都指定为
utf8mb4_general_ci
当然也可以全部指定为utf8mb4_unicode_ci
, 根据实际需要进行处理即可)
select a.id, b.id from tt as a, t2 as b where a.xx = b.xx collate utf8mb4_general_ci 复制代码
2. mysql字符集
字符集
对于国内的小伙伴,一般而言我们常见的字符集有下面三种
gbk
: 两字节utf8
: 三个字节utf8mb4
: 四个字节
而mysql实际支持的就比较多了,可以通过show charset;
进行查询
校验规则
在实际的case中,经常会看到下面几种
utf8_bin
utf8mb4_unicode_ci
utf8mb4_general_ci
latin1_general_cs
当然我们也可以通过 show collation;
查看所支持的校验规则
请注意上面的写法
- ci:
case insensitive的缩写
大小写不敏感 - cs:
case sensitive
大小写敏感 - bin: 二进制存储,大小写敏感