前言: MySQL开篇前言补充含有前三点,先认识大概的MySQL,从下一篇开始进入MySQL的核心技术讲解。
一 . MySQL开篇前言补充 存储:一个完整的数据存储过程是怎样的?
1.1 数据存储过程
MySQL是怎么进行数据存储的。
存储数据是处理数据的第一步,对各种繁杂的数据,进行有序和高效地存储起来。
在MySQL中,完整的数据存储过程共有4步,分别是 创建数据库,确认字段,创建数据表,插入数据。
1.1.1 创建MySQl 数据库
数据存储的第一步就是创建数据库。
1.1.1.1 为什么我们要先创建一个数据库,而不是直接创建数据表?
数据库是MySQL里面最大的存储单元,系统架构层次上看,MySQL数据库系统,从小到大依次是数据库服务器,数据库,数据表,数据表的行与列。
没有数据库,数据表就没有载体,就无法存储数据。
1.1.1.2基本操作部分
1.1.1.2.1 创建数据库
create database demo;
1.1.1.2.2 删除数据库
drop database demo;
1.1.1.2.3 查看数据库
show databases;
1.1.1.2.4 创建数据表:
create table demo.test ( barcode text, goodsname text, price int );
1.1.1.2.5 查看表结构
describe demo.test;
1.1.1.2.6 查看所有表
show tables;
1.1.1.2.7 添加主键
alter table demo.test add column itemnumber int primary key auto_increment
1.1.1.2.8 向表添加数据
insert into demo.test (barcode,goodsname,price) values('0001','本',3);
1.2 选择索引问题
select count(*) from t; t中有id(主键),name,age,sex4个字段。假设数据10条,对sex添加索引。用explain 查看执行计划发现用了sex索引,为什么不是主键索引呢?主键索引应该更快的.
1.2.1 选择优先索引解答:
MySQL Innodb的主键索引是一个B+树,数据存储在叶子节点上,10条数据,就有10个叶子节点。
1. sex索引是辅助索引,也是一个B+树,不同之处在于,叶子节点存储的是主键值,由于sex只有2个
可能的值:男和女,因此,这个B+树只有2个叶子节点,比主键索引的B+树小的多
2. 这个表有主键,因此不存在所有字段都为空的记录,所以COUNT(*)只要统计所有主键的值就可以
了,不需要回表读取数据
3. SELECT COUNT(*) FROM t,使用sex索引,只需要访问辅助索引的小B+树,而使用主键索引,要
访问主键索引的那个大B+树,明细工作量大,这就是为什么,优化器使用辅助索引的原因
二 . MySQL开篇前言补充 字段:这么多的字段类型,应该如何定义
2.1 简介
MySQl中有很多字段类型,比如整数,文本,浮点数。
2.1.1 例子:
在销售流水表中,需要定义商品销售的数量。由于有称重
商品,不能用整数,想当然地用了浮点数,为了确保精度,还用了 DOUBLE 类型。
结果却造成了在没有找零的情况下,客人无法结账的重大错误,DOUBLE 类型是不精准的,不能使用。
2.1.1.1解释:
浮点数在计算机中的内部表示是二进制的,而不是十进制的。对于某些常见的十进制小数(如0.1),其在二进制表示中是一个无限循环的小数。这样就存在一些十进制小数无法准确转换为浮点数的二进制表示。
当进行浮点数计算时,舍入误差会逐渐累积。即使看似简单的计算,例如0.1 + 0.1 + 0.1,也可能产生一个微小的舍入误差。这意味着在处理货币或计量单位时,通过浮点数计算得到的结果可能与预期的结果有细微差异。
在结账场景中,如果使用浮点数(DOUBLE)存储商品销售的数量和金额,并进行计算,那么可能会出现舍入误差。例如,如果商品价格是0.1元,数量是3个,正确的总金额应该是0.3元。但由于浮点数的舍入误差,实际计算时可能得到一个接近0.30000000000000004的结果。这样就导致无法准确匹配预期的金额,客人无法正确结账。
因此,在处理与货币或计量单位相关的数据时,浮点数(DOUBLE)类型不是一个理想的选择,因为它可能引发舍入误差和精度问题。更好的选择是使用固定点数类型(如DECIMAL),它可以提供更高的精确度和准确性来处理这些情况,避免结账错误的发生。
2.2 整数类型
整数类型一共5种:tinyint ,smallint,mediumint,int(integer),bigint。
2.2.1 如何选择合适的整数类型
需要考虑存储空间和可靠性的平衡问题:
占用字节数少的整数类型可以节省出存储空间,如果太小了,可能会出现超出取值范围的情况,引发系统问题。
例子:
在我们的项目中,商品编号采用的数据类型是 INT。
我们之所以没有采用占用字节更少的 SMALLINT 类型整数,原因就在于,客户门店中流通的
商品种类较多,而且,每天都有旧商品下架,新商品上架,这样不断迭代,日积月累。如果使
用 SMALLINT 类型,虽然占用字节数比 INT 类型的整数少,但是却不能保证数据不会超出范
围 65535。相反,使用 INT,就能确保有足够大的取值范围,不用担心数据超出范围影响可
靠性的问题。
注意:实际工作中,系统故障产生的成本远远超过增加几个字段存储空间所产生的成本,我们应该首先确保数据不会超过取值范围,在这个前提下考虑如何节省存储空间。
2.3 浮点数类型和定点类型
浮点数和定点数的特点是可以处理小数,将整数看成小数的特例。
浮点数类型:float,double,real
float 表示单精度浮点数;4字节
double 表示 双精度浮点数 8字节
real 默认 double,
如果要float:set sql_mode = " real_as_float";
2.3.1 为什么浮点数类型的无符号只有有符号的一半取值范围?
原因是MySQL 是按照这个格式存储浮点数的:符号(S)、尾数(M)和阶
码(E)。因此,无论有没有符号,MySQL 的浮点数都会存储表示符号的部分。因此,所谓
的无符号数取值范围,其实就是有符号数取值范围大于等于零的部分。
2.3.2 浮点数的精度问题
2.3.2.1 建表:
CREATE TABLE demo.goodsmaster ( barcode TEXT, goodsname TEXT, price DOUBLE, itemnumber INT PRIMARY KEY AUTO_INCREMENT );
2.3.2.2 然后插入数据
-- 第一条 INSERT INTO demo.goodsmaster ( barcode, goodsname, price ) VALUES ( '0001', '书', 0.47 ); -- 第二条 INSERT INTO demo.goodsmaster ( barcode, goodsname, price ) VALUES ( '0002', '笔', 0.44 ); -- 第三条 INSERT INTO demo.goodsmaster ( barcode, goodsname, price ) VALUES ( '0002', '胶水', 0.19 );
2.3.2.3 查看表里面的数据
SELECT * from demo.goodsmaster;
结果:
mysql> SELECT * -> FROM demo.goodsmaster; +---------+-----------+-------+------------+ | barcode | goodsname | price | itemnumber | +---------+-----------+-------+------------+ | 0001 | 书 | 0.47 | 1 | | 0002 | 笔 | 0.44 | 2 | | 0002 | 胶水 | 0.19 | 3 | +---------+-----------+-------+------------+ 3 rows in set (0.00 sec)
2.3.2.4 利用SQl语句进行价格相加:
1. SELECT SUM(price) 2. FROM demo.goodsmaster;
2.3.2.4.1 sum:
关键字sum,MySQL的求和函数,MySQL聚合函数的一种,知道这个函数表述计算字段值的和就可以了。
我们应该理想的值,0.47+0.44+0.19 =1.1
结果:
mysql> SELECT SUM(price) -> FROM demo.goodsmaster; +--------------------+ | SUM(price) | 查询结果是 1.0999999999999999
将类型改成float,输出的值为1.0999999940395355,误差更大。
当我们需要进行值对比作为条件进行查询的时候,就会发生误差。
比如:
SELECT * FROM demo.goodsmaster WHERE SUM(price)=1.1
2.3.2.4.1.1 导致这个的原因;
出在 MySQL 对浮点类型数据的存储方式上。
MySQL 用 4 个字节存储 FLOAT 类型数据,用 8 个字节来存储 DOUBLE 类型数据。无论哪
个,都是采用二进制的方式来进行存储的。比如 9.625,用二进制来表达,就是 1001.101,
如果尾数不是 0 或 5(比如 9.624)。
在计算机中,所有数字都是以二进制的形式表示的。因此,将十进制小数转换为二进制小数是非常重要的,这样计算机才能够进行准确的计算和精确的表示。 证明这种转换方式的正确性其实很简单。我们知道,在十进制中,小数点左侧的每一位数位的权重都是10的非负整数次幂,如: 1000 100 10 1 . 1/10 1/100 1/1000 10^3 10^2 10^1 10^0 10^-1 10^-2 10^-3 同样地,在二进制中,小数点右侧的每一位数位的权重都是2的负整数次幂,如: . 1/2 1/4 1/8 1/16 1/32 1/64 2^-1 2^-2 2^-3 2^-4 2^-5 2^-6 2^-7 因此,我们可以将十进制小数乘以2,并取整数部分,再将所得到的小数部分继续乘以2,直到小数部分为0或者达到所需要的位数。这样,就可以通过二进制小数精确地表示十进制小数。 当然,二进制小数并非适用于所有的十进制小数,有些十进制小数是无法精确地表示为有限的二进制小数的。但是,在实际应用中,我们通常只需要使用有限位数的二进制小数来进行计算。因此,通过乘以2并取整的方法来转换小数可以满足大多数应用场景的需求。
你就无法用一个二进制数来精确表达。怎么办呢?就只好在取值允许的范围内进行近似(四舍五入)。现在你一定明白了,为什么数据类型是 DOUBLE 的时候,我们得到的结果误差更小一些,而数据类型是 FLOAT 的时候,误差会更大一下。原因就是,DOUBLE 有 8 位字节,精度更高。
2.3.2.5 解决小数的精度问题
定点数类型 decimal是一种用于精确表示小数的数据类型,它的实现方式可以保证精度的正确性。 decimal 类型一般由两个部分组成:整数部分和小数部分。整数部分用于表示正负号和整数部分的数值,而小数部分用于表示小数的位数和数值。
在 decimal 类型中,精度是由小数部分的位数定义的。
2.3.2.5 .1 decimal 解释的例子:
decimal(5,2) 表示总共有 5 位数,其中 2 位是小数位。这意味着 decimal 类型可以表示从 -99.99 到 +99.99 的范围内的任意小数,且小数部分会被精确地保留到两位小数。
decimal类型的实现会使用一些算法来确保精度的正确性,例如四舍五入、进位等。这样,无论使用 decimal 类型进行何种数学运算,系统都会在内部处理这些算法,以保证最终结果的精度是正确的。
因此,使用 decimal 类型可以有效地确保小数的精度是正确的。在进行计算过程中,如果需要保持较高的精度,请选择合适的 decimal 类型和位数,以适应应用的需求。
2.4 文本类型
对于存储的条码、商品名称,都是字符串数据。这两个字段的数据类型,我们可能都选择了 TEXT 类型。
2.4.1 TEXT 类型
是 MySQL 支持的文本类型的一种。此外,MySQL 还支持 CHAR、VARCHAR、
ENUM 和 SET 等文本类型。
2.4.2 CHAR(M):
固定长度字符串。CHAR(M) 类型必须预先定义字符串长度。如果太短,数据
可能会超出范围;如果太长,又浪费存储空间。
2.4.3 VARCHAR(M):
可变长度字符串。VARCHAR(M) 也需要预先知道字符串的最大长度,不
过只要不超过这个最大长度,具体存储的时候,是按照实际字符串长度存储的。
2.4.4 TEXT:
字符串。系统自动按照实际长度存储,不需要预先定义长度。
2.4.5 ENUM:
枚举类型,取值必须是预先设定的一组字符串值范围之内的一个,必须要知道字
符串所有可能的取值。
SET:是一个字符串对象,取值必须是在预先设定的字符串值范围之内的 0 个或多个,也必
须知道字符串所有可能的取值。
2.4 .1 详细解释TEXT类型
TEXT 类型也有 4 种,它们的区别就是最大长度不同。
TINYTEXT:255 字符(这里假设字符是 ASCII 码,一个字符占用一个字节,下同)。
TEXT: 65535 字符。
MEDIUMTEXT:16777215 字符。
LONGTEXT: 4294967295 字符(相当于 4GB)。
TEXT 有一个问题:由于实际存储的长度不确定,
MySQL 不允许TEXT 类型的字段做主键。
遇到这种情况,我们只能采用 CHAR(M),或者 VARCHAR(M)。
三 . MySQL开篇前言补充 表:怎么创建和修改数据表?
3.1 解释
创建和修改数据表,是数据存储过程中的重要一环。我们不仅需要把表创建出来,还需要正确地设置限定条件,这样才能确保数据的一致性和完整性。同时,表中的数据会随着业务需求的
变化而变化,添加和修改相应的字段也是常见的操作。
3.2添加数据
1. 2. INSERT INTO 表名 [(字段名 [,字段名] ...)] VALUES (值的列表);
3.3插入数据记录
MySQL 支持的数据插入操作十分灵活。你既可以通过给表里面所有的字段赋值,完整
地插入一条数据记录,也可以在插入记录的时候,只给部分字段赋值。
3.4例子:
demo.goodsmaster 的表,包括了 itemnumber、barcode、
goodsname、specification、unit 和 price 共 6 个字段。我想要插入一条数据记录,其中包
含了所有字段的值,
INSERT INTO demo.goodsmaster ( itemnumber, barcode, goodsname, specification, unit, price ) VALUES ( 4, '0003', '尺子', '三角型', '把', 5 );
查询后:
mysql> SELECT * -> FROM demo.goodsmaster; +------------+---------+-----------+---------------+------+-------+ | itemnumber | barcode | goodsname | specification | unit | price | +------------+---------+-----------+---------------+------+-------+ | 4 | 0003 | 尺子 | 三角型 | 把 | 5.00 | +------------+---------+-----------+---------------+------+-------+ 1 row in set (0.01 sec)
也可以只给部分字段赋值,对应取值就行。
如果没有赋值需要考虑的情况:
3.4.1 第一种情况:
如果字段允许为空,而我们没有给它赋值,那么 MySQL 会自动给它们赋予空
值。在刚刚的代码中,“specification”“unit”字段都允许为空,因此,如果数据插入语句
没有指定这几个字段的值,MySQL 会自动插入空值。
3.4.2 第二种情况:
如果字段是主键,就不能为空,这个时候,MySQL 会按照我们添加的约束进
行处理。比如字段“itemnumber”是主键,不能为空,而我们定义了自增约束,所以MySQL 自动在之前的最大值基础上加了 1。因此,“itemnumber”也有了自己该有的值。
3.4.3 第三种情况:
如果有一个字段定义不能为空,又不是主键,当你插入一条数据记录的时候,
就必须给这个记录赋值。
进行操作:
1. ALTER TABLE demo.goodsmaster 2. MODIFY specification TEXT NOT NULL;
将没有进行赋值的字段“specification”进行赋值或者进行删除,再进行字段“specification”添加非空约束的操作冲突了。
因此,我们要把字段“speicification”的值为空的数据记录删除,然后再修改字段约束: