MySQL数据库——SQL优化（1/3）-介绍、插入数据、主键优化-阿里云开发者社区

MySQL数据库——SQL优化（1/3）-介绍、插入数据、主键优化

2024-06-06 480

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： MySQL数据库——SQL优化（1/3）-介绍、插入数据、主键优化

介绍

SQL优化将分为下面几个部分进行学习：

插入数据
主键优化
order by优化
group by优化
imit优化

count优化
update优化

首先就先来看第一方面，

插入数据

Insert

如果我们需要一次性往数据库表中插入多条记录，可以从以下三个方面进行优化。

insert into tb_test values(1,'tom');
insert into tb_test values(2,'cat');
insert into tb_test values(3,'jerry');

优化方案一

批量插入数据

Insert into tb_test values(1,'Tom'),(2,'Cat'),(3,'Jerry');

优化方案二

手动控制事务

start transaction;
insert into tb_test values(1,'Tom'),(2,'Cat'),(3,'Jerry');
insert into tb_test values(4,'Tom'),(5,'Cat'),(6,'Jerry');
insert into tb_test values(7,'Tom'),(8,'Cat'),(9,'Jerry');
commit;

优化方案三

主键顺序插入，性能要高于乱序插入。

1 主键乱序插入 : 8 1 9 21 88 2 4 15 89 5 7 3

2 主键顺序插入 : 1 2 3 4 5 7 8 9 15 21 88 89

大批量插入数据

如果一次性需要插入大批量数据(比如: 几百万的记录)，使用insert语句插入性能较低，此时可以使

用MySQL数据库提供的load指令进行插入。操作如下：

可以按照我们指定的格式，批量插入数据。

-- 客户端连接服务端时，加上参数 -–local-infile
mysql –-local-infile -u root -p
 
-- 设置全局参数local_infile为1，开启从本地加载文件导入数据的开关
set global local_infile = 1;
 
-- 执行load指令将准备好的数据，加载到表结构中
load data local infile '/root/sql1.log'   -- 本地文件路径
into table tb_user fields terminated by ','  -- 字段间分隔符
lines terminated by '\n' ;                   -- 行间分隔符

在load时，主键顺序插入性能高于乱序插入。

主键优化

在上面提到，主键顺序插入的性能是要高于乱序插入的。下面就来介绍一下具体的原因，然后再分析一下主键又该如何设计。

数据组织方式

在InnoDB存储引擎中，表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表
(index organized table IOT)。

行数据，都是存储在聚集索引的叶子节点上的。

我们之前也看过InnoDB的逻辑结构图：

在InnoDB引擎中，

数据行是记录在逻辑结构 page 页中的，而每一个页的大小是固定的，默认16K。

那也就意味着，一个页中所存储的行也是有限的，如果插入的数据行row在该页存储不小，将会存储到下一个页中，页与页之间会通过指针连接。

页分裂

页可以为空，可以填充一半，也可以填充100%。每个页包含了2-N行数据(如果一行数据过大，会行溢出)，根据主键排列。

主键顺序插入效果

主键按乱序插入效果

假如1#，2#页都已经写满了，存放了如图所示的数据

此时再插入id为50的记录，不会再开启一个新的页然后插入

因为索引结构的叶子节点是有顺序的。按照顺序，应该存储在47之后。

但是47所在的1#页已经写满了，存储不了50对应的数据了。

那么此时会开辟一个新的页 3#，但是并不会直接将50存入3#页，而是会将1#页后一半的数据，移动到3#页，然后在3#页，插入50。

移动数据，并插入id为50的数据之后，那么此时，这三个页之间的数据顺序是有问题的。

1#的下一个页，应该是3#， 3#的下一个页是2#。所以，此时，需要重新设置链表指针。

上述的这种现象，就称之为 "页分裂"，是比较耗费性能的操作。

页合并

目前表中已有数据的索引结构(叶子节点)如下：

当我们对已有数据进行删除时，具体的效果如下:

当删除一行记录时，实际上记录并没有被物理删除，只是记录被标记（flaged）为删除并且它的空间变得允许被其他记录声明使用。

当我们删除2#的数据记录达到MERGE_THRESHOLD（默认为页的50%），InnoDB会开始寻找最靠近的页（前或后）看看是否可以将两个页合并以优化空间使用。

删除数据，并将页合并之后，若再次插入新的数据20，则直接插入3#页

这个里面所发生的合并页的这个现象，就称之为 "页合并"。

MERGE_THRESHOLD：合并页的阈值，可以自己设置，在创建表或者创建索引时指定。

索引设计原则

满足业务需求的情况下，尽量降低主键的长度。
插入数据时，尽量选择顺序插入，选择使用AUTO_INCREMENT自增主键。
尽量不要使用UUID做主键或者是其他自然主键，如身份证号。

业务操作时，避免对主键的修改。

UUID是国际标准化组织（ISO）提出的一个概念。用来识别属性类型，在所有空间和时间上被视为唯一的标识。

UUID是基于当前时间、计数器（counter）和硬件标识（通常为无限网卡的MAC地址）等数据计算生成的。

可以保证这个值是真正唯一的任何地方产生的任意一个UUID都不会有相同的值。

END

MySQL数据库——SQL优化（1/3）-介绍、插入数据、主键优化

介绍

插入数据

Insert

大批量插入数据

主键优化

数据组织方式

页分裂

索引设计原则

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

MySQL数据库——SQL优化（1/3）-介绍、插入数据、主键优化

介绍

插入数据

Insert

大批量插入数据

主键优化

数据组织方式

页分裂

索引设计原则

热门文章

最新文章

相关课程

相关电子书

推荐镜像