1 float, float(m), float(m,n)
在做MySQL开发时,使用到double变量时,有的开发会指定精度,写成这样double(10),或者这样double(10,1),前者指定数字的precision(翻译成精度,指数值中所有有效数字的数量),后者除了执行数值的precision之外,还指定数值的scale(翻译成范围或者是刻度,指定数值中小数点之后的位数)。也有的开发者不指定精度,直接写成double。这两种写法除了业务上的需要之外,还有别的区别吗?
这两种写法在性能上基本上没有什么差别,就是float和double相比,在性能上也没有很大的差别,因为在计算时,float(单精度浮点数)也是作为double来计算的(这里忽略因数据存储造成的性能差异,比如每个索引页存储的键的数量)。
除了性能因素外,这两者在存储上可能会有所不同,MySQL官方文档中有一段说到是否指定precision对float的影响:
For FLOAT, the SQL standard permits an optional specification of the precision (but not the range of the exponent) in bits following the keyword FLOAT in parentheses, that is, FLOAT. MySQL also supports.this optional precision specification, but the precision value in FLOAT, is used only to determine storage size. A precision from 0 to 23 results in a 4-byte single-precision FLOAT column. A precision from 24 to 53 results in an 8-byte double-precision DOUBLE column。
上面的官方文档说的时float,简单翻译一下
对于float,指定precision 只决定存储的大小,precision 值为0至23使用4字节单精度存储,precision 值为23至53 使用双精度8字节存储。
这段话应该怎么理解,用一个例子来说明一下比较直观:
mysql> create table t_f(id int, num1 float, numb2 float(12), num3 float(26), num4 float(12, 1), num5 float(32, 1)); Query OK, 0 rows affected, 2 warnings (0.15 sec) mysql> desc t_f; +-------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+-------------+------+-----+---------+-------+ | id | int | YES | | NULL | | | num1 | float | YES | | NULL | | | numb2 | float | YES | | NULL | | | num3 | double | YES | | NULL | | | num4 | float(12,1) | YES | | NULL | | | num5 | float(32,1) | YES | | NULL | | +-------+-------------+------+-----+---------+-------+ 6 rows in set (0.00 sec) mysql> insert into t_f values (1, 2222222222222222222222222,222222222,1111.234,1111111111,111111111); Query OK, 1 row affected (0.02 sec) mysql> select * from t_f; +------+------------+-----------+----------+--------------+-------------+ | id | num1 | numb2 | num3 | num4 | num5 | +------+------------+-----------+----------+--------------+-------------+ | 1 | 2.22222e24 | 222222000 | 1111.234 | 1111111168.0 | 111111112.0 | +------+------------+-----------+----------+--------------+-------------+ 1 row in set (0.00 sec)
创建表时使用的float(12)类型,在用desc显示表的信息时显示为float,float(25),直接显示为double,可以看出,只指定精度,MySQL数据库会根据指定的精度选择float或者double类型。如果时同时指定精度和刻度呢,加一列看一下:
mysql> alter table t_f add salary float(10, 2); Query OK, 0 rows affected, 1 warning (0.09 sec) Records: 0 Duplicates: 0 Warnings: 1 ------ mysql> alter table t_f add last_name varchar(10); Query OK, 0 rows affected (0.09 sec) Records: 0 Duplicates: 0 Warnings: 0 mysql> desc t_f; +-----------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-----------+-------------+------+-----+---------+-------+ | id | int | NO | PRI | NULL | | | name | varchar(10) | YES | | NULL | | ------------省略多行------------------------------------ | salary | float(10,2) | YES | | NULL | | | last_name | varchar(10) | YES | | NULL | | +-----------+-------------+------+-----+---------+-------+ 10 rows in set (0.00 sec)
在指定scale的情况下,用desc显示表的信息时就是我们创建表时的指定的类型。
2 double还是double(m),double(m,n)
mysql> create table t_d_n(id double(20,1), d1 double(20,4), d2 double(20,0)); Query OK, 0 rows affected, 3 warnings (0.14 sec)
上面的说法是针对float的,对double来说,指定scale对存储的影响则没有说明,下面通过MySQL数据文件的转储文件来验证一下。MySQL数据库的版本如下
mysql> select version(); +-----------+ | version() | +-----------+ | 8.0.32 | +-----------+ 1 row in set (0.00 sec)
使用验证表的信息如下
mysql> desc t_f; +--------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +--------+-------------+------+-----+---------+-------+ | id | int | NO | PRI | NULL | | | name | varchar(10) | YES | | NULL | | | salary | double | YES | | NULL | | | dept | varchar(10) | YES | | NULL | | | comm | double(4,1) | YES | | NULL | | | city | varchar(8) | YES | | NULL | | +--------+-------------+------+-----+---------+-------+ --表里面有如下数据-- mysql> select * from t_f; +----+------+----------------+------+-------+--------+ | id | name | salary | dept | comm | city | +----+------+----------------+------+-------+--------+ | 1 | aaaa | 1200 | bbb | 120.1 | aaaaaa | | 2 | cccc | 12000000000000 | ddd | 128.1 | aaaaaa | +----+------+----------------+------+-------+--------+ 2 rows in set (0.00 sec)
从上面显示的表的数据里可以看出,每行数据都是以字符串’aaaaa’结束,两个数字列键都有字符串做分隔。这么做的原因,是因为MySQL Innodb引擎对行的数据存储是连续的,每一行的数据按照列的顺序依次存储。这样我们在寻找列的数据时,通过字符串可以很简单的找的数据,而不用关注MySQL Innodb存储的细枝末节,做复杂的推算。使用下面的命令获得这个表的数据文件的转储。
[root@dbserver test]# hexdump -C -v t_f.ibd >t_f.txt ####查找字符串’aaaaaa’,找到每行数据,字符a的ASCII码是61,字符b的ASCII码是62,我们在转储文件里查找连续的6个61,使用下面的命令 [root@dbserver test]grep '61 61 61 61 61 61' t_f.txt -B 1 ####查找字符串’aaaaaa’,找到每行数据,字符a的ASCII码是61,字符b的ASCII码是62,我们在转储文件里查找连续的6个61,使用下面的命令 [root@dbserver test]grep '61 61 61 61 61 61' t_f.txt -B 1 ----这个命令的输出如下所示: 000100f0 20 28 85 61 61 61 61 00 00 00 00 00 c0 92 40 62 | (.aaaa.......@b| 00010100 62 62 66 66 66 66 66 06 5e 40 61 61 61 61 61 61 |bbfffff.^@aaaaaa| 00010110 06 03 04 00 01 40 00 28 ff 56 80 00 00 02 00 00 |.....@.(.V......| 00010120 00 00 24 48 02 00 00 01 20 28 a5 63 63 63 63 00 |..$H.... (.cccc.| 00010130 00 80 79 ef d3 a5 42 64 64 64 33 33 33 33 33 03 |..y...Bddd33333.| 00010140 60 40 61 61 61 61 61 61 00 00 00 00 00 00 00 00 |`@aaaaaa........|
第一行数据以字符串’aaaa’开始,字符串’aaaaaa’结束,sal和comm列之间以3个字符b(62)隔开,十六进制转储如下:
20 28 85 61 61 61 61 00 00 00 00 00 c0 92 40 62 62 62 66 66 66 66 66 06 5e 40 61 61 61 61 61 61
从上面的转储可以看到,salary的值1200,comm的值120.1,都占了8个字节的存储空间
第二行以字符串’cccc’开始,以字符串’aaaaaa’结束,列之间以’dddd’隔开,十六进制转储如下:
63 63 63 63 00 00 80 79 ef d3 a5 42 64 64 64 33 33 33 33 33 03 60 40 61 61 61 61 61 61
同样,从上面的转储看到salary的值12000000000000,comm的值128.1 也都占用的8个字节的存储空间。
从上面简单的实验可以看到,写成double或者是double(m,n),占用的存储空间都是8个字节。从效率和占用的存储空间来说,这两种写法没有任何差别。
既然从性能和存储空间来说,这两种写法没有任何区别,MySQL为何还要提供double(m),和doulbe (m,n)两种写法,我觉得有两个原因,一个是适应用户的习惯用法,另一个是对数据的输入和显示进行限制,这个在下一小节讲。
3 从开发的角度看double和double(m),double(m,n)
CREATE TABLE `t_d_1` ( `id` double NOT NULL, `name` varchar(10) DEFAULT NULL, `salary` double DEFAULT NULL, `dept` varchar(10) DEFAULT NULL, `comm` double(4,1) DEFAULT NULL, `city` varchar(8) DEFAULT NULL, PRIMARY KEY (`id`) ) --要注意的是double类型在MySQL 8.0.32 版本中不支持只指定precision的写法,如double(20) create table t_d_n(id int not null, d1 double,d2 double(20)); ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '))' at line 1 --象下面这样写就不会报错了 create table t_d_m(id int not null,d1 double,d2 double(20,1)); Query OK, 0 rows affected, 1 warning (0.31 sec) --也不能在表中加入写成象double(20)形式的列 alter table t_d_m add d1 double(20); ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near ')' at line 1
写成double(precision,scale)的形式一是有形式或这规范上的意义,一眼可以看出这个数据的取值范围和精确度,另外一是一种约束,超过指定范围的数值会被拒绝。
mysql> create table t_f(id int, num4 double(4, 2)); Query OK, 0 rows affected, 1 warning (0.18 sec) --形式不重要,但是输入的数值应该在取值范围之内 mysql> insert into t_f values (1, 12.321); Query OK, 1 row affected (0.03 sec) mysql> insert into t_f values (1, 99.99); Query OK, 1 row affected (0.03 sec) --超出取值范围,语句执行报错 mysql> insert into t_f values (1, 100.0); ERROR 1264 (22003): Out of range value for column 'num4' at row 1
4 小结一下
从数据库性能的角度来看,double写成哪种形式基本没影响,对float来说,在1-23为之间,最好指定precision,这个会减少一般存储空间,进而对表及索引的性能会有一定的影响。但是从开发的角度看,数字后面加上precision和scale就十分有必要了,一方面可以限制数值的输入范围,一方面也有业务方面的意义。