上篇文章我们说了mysql客户端到服务端会不同的字符集不断转换,其中服务端有三个重点的系统变量,1.处理客户端发来的字节串:character_set_client。2.吧请求的字节串从character_Set_cliect转成character_set_connection。3.吧字节串返回给客户端:character_Set_result。
如果你的select * from table_A where name = ‘我的’;返回的结果显示编码报错怎么办呢?
把我们可以从字节集的流程开始分析,他可能在第一步character_Set_client转换的时候就出现乱码问题,比如我们客户端发送的字节串是utf8的,但服务器的character_Set_client不是,就会乱码。也有可能character_Set_result字符集和客户端读取的字符集不一致也会乱码。这时候可以用:
Show variables like ‘character_Set_resultes’;
查看是否是和客户端相同的字符集,需要注意的是,mac的客端默认字符集是utf8,windows默认gbk。
字节串在服务器里面相互解码编码不是很影响性能吗,答案是肯定的,所以mysql给了一个sql,吧这三个系统参数一起修改字符集:set names '字符集';也可以单个修改,sql如下。
mysql> set names 'utf8'; Query OK, 0 rows affected (0.00 sec) mysql> set character_Set_Results = 'utf8'; Query OK, 0 rows affected (0.00 sec)
主要流程就是:
1、mac客户端发送uft8字符集的字节串给服务器,服务器用character_Set_client解析。(如果采用的是navicat等客户端,客户端可能会自定义其字节的字符集进行发送)
2、如果character_set_connection字符集和 character_Set_client不同,则‘我的’字节串 ,会先由utf8找到其对应的字符串’我的‘进行解码,解码之后,再有character_Set_connection的字符集gbk或者什么字符集进行编码处理。
3、这时候看看查询的列字符集是否与character_Set_connection是否一致,如果不一致,还需要和上面那样进行转换。
4、吧character_Set_connection返回的字节串先解码成字符串,然后在用character_Set_results编码成utf8新的字节串返回给客户端
5、由于客户端使用的字符集和character_Set_results是相同的字符集,所以我们能正常查看。
比较规则的应用:
gbk_chinese_ci是不区分大小写排序的,比如order by 排序字段,返回的结果可能是’a’,’A’,’b’,’B’。
当我们用修改当前字段列的字符集为gbk_bin,order by排序之后,可以返回’A’,’B’,’a’,’b’。所以当我们排序时候,没有我们想要的结果,也可以考虑是否是比较规则的问题。