常用数据类型对比
1、整数(whole number)和实数(real number)
如果存储整数,可以有TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,分别使用8、16、24、32、64位存储空间。整数类型可选的UNSIGNED属性,表示不负值,这大致可以使正数的上限提高一倍。选择决定MySQL是怎么在内存和磁盘中爆粗数据的。然而,整数计算一般使用64位BIGINT整数,即使32位环境也是如此。MySQL可以为整数类型指定宽度,例如INT(11),对于大多数应用这是没有意义的,它不会限制值的合法范围,只是规定了MySQL的一些交互工具用来显示字符的个数。对于存储和计算来说INT(1)和INT(20)意义是一样的。
实数是带有小数的数字,FLOAT和DOUBLE类型支持使用标准的浮点运算,DECIMAL类型用于存储精确的小数,支持精确的小数计算。因为CPU不支持DECIMAL的直接计算,所以相对而言浮点预算明显快。DECIMAL可以指定精度,精度会影响列的空间消耗,如DECIMAL(18,9)使用9个字节(每4个字节存9个数字)。MySQL5.0以及更高版本中的DECIMAL允许最多65个数字。DECIMAL只是一种存储格式,在计算中DECIMAL会转换成为DOUBLE类型。浮点类型在存储同样范围的值时,通常比DECIMAL使用更少的空间。FLOAT使用4个字节,DOUBLE8个字节。和整数类型一样,能选择的只是存储类型,MySQL使用DOUBLE作为内部浮点计算的类型。一般平时的做法是用BIGINT代替DECIMAL(将小数乘以精确的位数保存为整数)。
2、字符串类型
VARCHAR类型用于存储可变字符串(如果MySQL表使用ROW_FORMAT=FIXED创建的话,每一行都会使用定长)。VARCHAR使用1或者2个额外的字节记录字符串的长度。VARCHAR节省了存储空间,但是因为可变长的,所以更新的时候需要做额外的开销。当字符串列的最大长度比平均长度大的多,列的更新很少时适合使用VARCHAR类型。在5.0或者更高版本,MySQL在存储和检索是会保留末尾空格,但在之前版本中不会。虽然VARCHAR(5)和VARCHAR(200)存储‘hello’空间开销一样,但后者消耗更多的内存,因为MySQL会分配固定大小的内存块来保存内部值。
CHAR类型是定长的,当存储CHAR时,MySQL会删除所有的末尾空格。CHAR值会根据需要采用空格填充以方便比较。CHAR适合存储很短的字符串或者值都接近同一个长度,如MD5值。因为CHAR是定长列,所以更新很快且不会产生碎片。
与CHAR和VARCHAR类似的还有BINARY和VARBINARY,他们存储的是二进制字符串。二进制字符串和常规字符串非常相似,但是二进制字符串存储的是字节码而不是字符。另外MySQL填充BINARY采用的是\0(零字节)而不是空格,检索时也不会去掉填充值。
BLOB和TEXT类型都是存储很大数据而设计的字符串类型,分别采用二进制和字符串方式存储。与其他类型不同,MySQL把每个BLOB和TEXT值作为一个独立对象处理,当二者值太大时,InnoDB会使用专门的“外部”存储区域来进行存储,此时行内只存储1~4个字节存储一个指向真实值的指针。二者仅有的区别是前者存储二进制数据且没有排序和字符集后者有字符集和排序。两者都通过max_sort_length字节而不是整个字符串做排序或者ORDER_BY_SUSTRING(column, length).
ENUM(枚举)有时候可以代替常用的字符串类型。MySQL在内部将每个值在列表中的位置保存为整数,并且在.frm文件中保存映射关系。ENUM的排序是按照内部存储的整数和布什定义的字符串进行排序的。枚举最不好的地方时,字符串列表是固定的,添加或删除字符串必须使用ALTER TABLE。因为ENUM是通过映射关系保存值的,所以某些特定情况下,ENUM与CHAR/VARCHAR进行关联比CHAR/VARCHAR列直接关联更慢。
3、日期和时间类型
MySQL能够存储的最小时间粒度是秒,MySQL有两种非常相似的日期类型:DATETIME和TIMESTAMP。DATETIME能够保存打范围的值(1001年-9999年),精度为秒,他把日期和时间封装到格式为YYYYMMDDHHMMSS的整数中,与时区无关。使用8个字节的存储空间。TIMESTAMP类型保存了1970年1月1日午夜(格林尼治时间)以来的秒数,它和UNIX时间戳相同,使用4个字节的存储空间,表示的范围是1970到2038年。
4、位数据类型
BIT在MySQL5.0之前是TINYINT的同义词,但是在5.0以后是一个特性完全不同的数据类型。BIT在一列中存储一个或者多个true/false。BIT(1)定义包含单个位的字段,BIT列的最大长度是64个位,不同的存储引擎存储BIT的方式有较大的区别。MySQL把BIT当做字符串类型,当检索BIT(1)时,结果是一个包含二进制的0或1字符串,而不是ASCII码的“0”或“1”。BIT类型有很多潜在的问题谨慎使用。
5、特殊数据类型
一个例子就是OPv4地址。MySQL提供INET_ATION()和INET_NTOA()函数在ip和int两种表示方法之间转换。
本文转自 古道卿 51CTO博客,原文链接:http://blog.51cto.com/gudaoqing/1286606