【MYSQL高级】数据生成与插入脚本编写与使用

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 【MYSQL高级】数据生成与插入脚本编写与使用

批量插入数据脚本

场景:需要插入50万个数据,分10次插入,每次查词5万条数据

建表sql

--  部门表
create table dept(
id int unsigned primary key auto_increment,
--  部门号
deptno mediumint unsigned not null default 0,
--  部门名称
dname varchar(20) not null default "",
--  楼层位置
loc varchar(13) not null default ""
)engine=innodb default charset=GBK;
--  员工表
CREATE TABLE emp(
id int unsigned primary key auto_increment,
--  员工编号
empno mediumint unsigned not null default 0,
--  员工名字
ename varchar(20) not null default "",
--  工作
job varchar(9) not null default "",
--  上级编号
mgr mediumint unsigned not null default 0,
-- 入职时间
hiredate date not null,
--  薪水
sal decimal(7,2) not null,
--  红利
comm decimal(7,2) not null,
--  部门编号
deptno mediumint unsigned not null default 0
)ENGINE=INNODB DEFAULT CHARSET=GBK;

函数创建与使用

由于开启过慢查询日志,开启了bin-log,我们就必须为function指定一个参数,否则使用函数会报错。

# log_bin_trust_function_creators 默认是关闭的 需要手动开启
mysql> SHOW VARIABLES LIKE 'log_bin_trust_function_creators';
+---------------------------------+-------+
| Variable_name                   | Value |
+---------------------------------+-------+
| log_bin_trust_function_creators | OFF   |
+---------------------------------+-------+
1 row in set (0.00 sec)
mysql> SET GLOBAL log_bin_trust_function_creators=1;
Query OK, 0 rows affected (0.00 sec)

上述修改方式MySQL重启后会失败,在配置文件my.ini/my.cnf下添加如下配置之后修改永久有效。

[mysqld]
# 如果上面的不行,就换成下面的
log_bin_trust_function_creators=ON
log_bin_trust_function_creators=1

工具函数创建

随机生成字符串
--  本来执行一段sql的结束符号是;,但是因为函数里面有;,先将结束符号修改为$$
DELIMITER $$
CREATE FUNCTION rand_string(n INT) RETURNS VARCHAR(255)
BEGIN
    --  声明一个字符串并赋值
    DECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwsyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
    DECLARE return_str VARCHAR(255) DEFAULT '';
    DECLARE i INT DEFAULT 0;
    WHILE i < n DO
    --  CONCAT:拼接;SUBSTRING:截取
    SET return_str = CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1));
    SET i = i + 1;
    END WHILE;
    RETURN return_str;
END $$
随机产生部门编号
DELIMITER $$
CREATE FUNCTION rand_num() RETURNS INT(5)
BEGIN
    DECLARE i INT DEFAULT 0;
    SET i = FLOOR(100 + RAND() * 10);
    RETURN i;
END $$

创建存储过程

向dept表批量插入数据
DELIMITER $$
--  IN START INT(10),IN max_num INT(10):从什么时候开始,到什么时候结束
CREATE PROCEDURE insert_dept(IN START INT(10),IN max_num INT(10))
BEGIN
DECLARE i INT DEFAULT 0;
--  将自动提交设置为零,后面批量提交,提高插入效率
    SET autocommit = 0;
    --  循环
    REPEAT
    SET i = i + 1;
    --  插入数据
    INSERT INTO dept(deptno,dname,loc) VALUES((START + i),rand_string(10),rand_string(8));
    --  循环的结束条件
    UNTIL i = max_num
    END REPEAT;
    COMMIT;
END $$
向emp表批量插入数据
DELIMITER $$
CREATE PROCEDURE insert_emp(IN START INT(10),IN max_num INT(10))
BEGIN
DECLARE i INT DEFAULT 0;
    SET autocommit = 0;
    REPEAT
    SET i = i + 1;
    INSERT INTO emp(empno,ename,job,mgr,hiredate,sal,comm,deptno) VALUES((START + i),rand_string(6),'SALESMAN',0001,CURDATE(),2000,400,rand_num());
    UNTIL i = max_num
    END REPEAT;
    COMMIT;
END $$

删除PROCEDURE

如果存储过程有问题,需要先删除原本的存储过程,再创建新的存储过程

drop PROCEDURE insert_emp;

调用存储过程

# 调用存储过程向dept表插入10个部门,id从100开始。
# 改回;结束
DELIMITER ;
CALL insert_dept(100,10);
# 调用存储过程向emp表插入50万条数据。
DELIMITER ;
CALL insert_emp(100001,500000);

执行过程

mysql> --  本来执行一段sql的结束符号是;,但是因为函数里面有;,先将结束符号修改为$$
mysql> DELIMITER $$
mysql> CREATE FUNCTION rand_string(n INT) RETURNS VARCHAR(255)
    -> BEGIN
    ->     --  声明一个字符串并赋值
    ->     DECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwsyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
    ->     DECLARE return_str VARCHAR(255) DEFAULT '';
    ->     DECLARE i INT DEFAULT 0;
    ->     WHILE i < n DO
    ->     --  CONCAT:拼接;SUBSTRING:截取
    ->     SET return_str = CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1));
    ->     SET i = i + 1;
    ->     END WHILE;
    ->     RETURN return_str;
    -> END $$
Query OK, 0 rows affected (0.01 sec)
mysql> DELIMITER $$
mysql> CREATE FUNCTION rand_num() RETURNS INT(5)
    -> BEGIN
    ->     DECLARE i INT DEFAULT 0;
    ->     SET i = FLOOR(100 + RAND() * 10);
    ->     RETURN i;
    -> END $$
Query OK, 0 rows affected, 1 warning (0.01 sec)
mysql> DELIMITER $$
mysql> --  IN START INT(10),IN max_num INT(10):从什么时候开始,到什么时候结束
mysql> CREATE PROCEDURE insert_dept(IN START INT(10),IN max_num INT(10))
    -> BEGIN
    -> DECLARE i INT DEFAULT 0;
    -> --  将自动提交设置为零,后面批量提交,提高插入效率
    ->     SET autocommit = 0;
    ->     --  循环
    ->     REPEAT
    ->     SET i = i + 1;
    ->     --  插入数据
    ->     INSERT INTO dept(deptno,dname,loc) VALUES((START + i),rand_string(10),rand_string(8));
    ->     --  循环的结束条件
    ->     UNTIL i = max_num
    ->     END REPEAT;
    ->     COMMIT;
    -> END $$
Query OK, 0 rows affected, 2 warnings (0.01 sec)
mysql> DELIMITER $$
mysql> CREATE PROCEDURE insert_emp(IN START INT(10),IN max_num INT(10))
    -> BEGIN
    -> DECLARE i INT DEFAULT 0;
    ->     SET autocommit = 0;
    ->     REPEAT
    ->     SET i = i + 1;
    ->     INSERT INTO emp(empno,ename,job,mgr,hiredate,sal,comm,deptno) VALUES((START + i),rand_string(6),'SALESMAN',0001,CURDATE(),2000,400,rand_num());
    ->     UNTIL i = max_num
    ->     END REPEAT;
    ->     COMMIT;
    -> END $$
Query OK, 0 rows affected, 2 warnings (0.01 sec)
mysql> --  调用存储过程向dept表插入10个部门,id从100开始。
mysql> --  改回;结束
mysql> DELIMITER ;
mysql> CALL insert_dept(100,10);
Query OK, 0 rows affected (0.01 sec)
mysql> select * from dept;
+----+--------+------------+----------+
| id | deptno | dname      | loc      |
+----+--------+------------+----------+
|  1 |    101 | wcUtjNoeHY | UCcGZduM |
|  2 |    102 | BsHUBXkijy | MrwiAcLz |
|  3 |    103 | mLUrbdokks | iOsAsKiL |
|  4 |    104 | gzcMDIDTKQ | aGdznPkG |
|  5 |    105 | zFDbskEuiG | HsQcOMsB |
|  6 |    106 | FyCoNWwssm | QtvWssWn |
|  7 |    107 | BTOmVPnXVM | ZKBDoHtW |
|  8 |    108 | DcAsLkUTHF | hSRHLGYb |
|  9 |    109 | iOtBBcJopJ | BEtgAgfh |
| 10 |    110 | wMwUjmFsYM | PQGLKrEW |
+----+--------+------------+----------+
10 rows in set (0.00 sec)
mysql> DELIMITER ;
mysql> CALL insert_emp(100001,500000);
Query OK, 0 rows affected (39.19 sec)

文章说明

本文章为本人学习尚硅谷的学习笔记,文章中大部分内容来源于尚硅谷视频(点击学习尚硅谷相关课程),也有部分内容来自于自己的思考,发布文章是想帮助其他学习的人更方便地整理自己的笔记或者直接通过文章学习相关知识,如有侵权请联系删除,最后对尚硅谷的优质课程表示感谢。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3天前
|
关系型数据库 MySQL API
实时计算 Flink版产品使用合集之可以通过mysql-cdc动态监听MySQL数据库的数据变动吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
24 0
|
4天前
|
SQL 关系型数据库 MySQL
MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
|
2天前
|
Oracle 关系型数据库 MySQL
实时计算 Flink版操作报错合集之用CTAS从mysql同步数据到hologres,改了字段长度,报错提示需要全部重新同步如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
43 8
|
2天前
|
SQL 资源调度 关系型数据库
实时计算 Flink版产品使用合集之在抓取 MySQL binlog 数据时,datetime 字段会被自动转换为时间戳形式如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
10 2
|
3天前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版产品使用合集之2.2.1版本同步mysql数据写入doris2.0 ,同步完了之后增量的数据延迟能达到20分钟甚至一直不写入如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
12 1
|
3天前
|
Oracle 关系型数据库 MySQL
实时计算 Flink版产品使用合集之Flink CDC 2.3.0和Flink 1.17,无法从MySQL数据库中抽取数据,是什么原因导致的
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
19 1
|
3天前
|
关系型数据库 MySQL 数据处理
实时计算 Flink版产品使用合集之如果在 MySQL 表中为某个字段设置了默认值,并且在插入数据时指定了该字段为 NULL,那么 MySQL 是否会使用默认值来填充这个字段
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
18 0
|
3天前
|
关系型数据库 MySQL Java
实时计算 Flink版产品使用合集之mysql通过flink cdc同步数据,有没有办法所有表共用一个dump线程
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
8 0
|
3天前
|
关系型数据库 MySQL Java
实时计算 Flink版产品使用合集之如果MySQL的binlog保存时间只有三天,那么三天之前的数据是不是会通过Doris的外表手动插入
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
12 0
|
4天前
|
存储 关系型数据库 MySQL