一、创建数据库
创建数据库
CREATE DATABASE [IF NOT EXISTS] db_name [[DEFAULT] CHARSET=charset_name] [[DEFAULT] COLLATE=collation_name];
SQL中大写的表示关键字,[ ]中代表的是可选项
CHARSET用于指定数据库所采用的编码格式
COLLATE用于指定数据库所采用的校验规则
注意:若创建数据库时未指明数据库的编码格式或校验规则,则默认使用MySQL配置文件中对应的编码格式或校验规则
采用默认的编码格式和校验规则创建数据库
创建数据库时不指定数据库的编码格式和校验规则即采用默认
注意: 若没有对MySQL的配置文件进行过修改,则默认的编码格式是utf8,默认校验规则是utf8_general_ci
指定utf8编码格式创建数据库
创建数据库时通过charset指明数据库的编码格式即可
注意: SQL中的charset=utf8,也可写成 character set=utf8 或 character set utf8
指定utf8编码格式和utf8_general_ci校验规则创建数据库
创建数据库时通过charset和collate分别指明数据库的编码格式和校验规则即可
注意: SQL中的collate=utf8_general_ci,也可写成collate utf8_general_ci
二、字符集&&校验规则
2.1 查看系统默认字符集与校验规则
查看系统默认的字符集
通过查看MySQL系统变量variables中的character_set_database,可以得知系统默认的字符集
注意: 若是在指定数据库下使用该SQL,则查看的是该数据库对应的字符集
查看系统默认的字符集校验规则
通过查看MySQL系统变量variables中的collation_database,可以得知系统默认的字符集校验规则
注意: 若是在指定数据库下使用该SQL,则查看的是该数据库对应的字符集校验规则
2.2 查看数据库支持的字符集
使用show charset可以查看数据库支持的字符集
注意: 字符集可以控制用什么语言,如utf8就可使用中文
2.3 查看数据库支持的字符集校验规则
使用 show collation可以查看数据库支持的字符集校验规则
2.4 校验规则对数据库的影响
字符集编码格式和字符集校验规则的区别
字符集编码格式指的是在存储数据时各个字符的底层编码,用于指定数据的存储格式
字符集校验规则是在字符集内用于比较字符的一套规则,用于对数据进行比对
比如存储数据的时候是按照utf8的格式进行存储的,那么将来在对数据做比对时也必须按照utf8的格式进行比对,"存数据"和"取数据"的方式必须保持一致
注意: 在对数据库中的数据进行增删查改时,不可避免的需要进行数据的比对。因为在对数据做增删查改之前,都需先通过比对的方式找到目标数据
校验规则对数据库的影响
为了保证读取的数据和存储的数据是一致的,因此字符集编码格式和校验规则必须是对应的。但实际同一中字符集编码格式一般会有多种可选择的校验规则,如utf8编码格式的校验规则有utf8_general_ci、utf8_bin、utf8_unicode_ci等校验规则
使用不同的校验规则操作数据库中的数据可能会得到不同的结果,如utf8_general_ci校验规则在比对数据时不区分大小写,而utf8_bin校验规则在对比数据时区分大小写
数据库采用utf8_general_ci校验规则
创建数据库时指定数据库的校验规则为utf8_general_ci,数据库的编码格式默认为utf8
在该数据库中创建一个简单的user表,由于创建未指定表的编码格式和校验规则,因此user表将继承当前数据库的编码格式和校验规则
向表中插入一些数据
通过select语句查看插入表中的数据
指定查看表中 name='a' 的记录时会将A和a一并筛选出来,根本原因就是utf8_general_ci校验规则在进行数据比对时不区分大小写
数据库采用utf8_bin校验规则
创建数据库时指定数据库的校验规则为utf8_bin,数据库的编码格式默认为utf8
在该数据库中同样创建和刚才一样的user表,该user表会将继承当前数据库的编码格式和校验规则
向表中插入与之前相同的数据
通过select语句可以看到表中的数据与之前相同
但这时指定查看表中name='a'的记录时只会将a筛选出来,根本原因就是utf8_bin校验规则在进行数据比对时区分大小写