php执行语句在MySQL批量插入大数据量的解决方案及计算程序执行时间(大数据量、MySQL语句优化)

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDSClaw,2核4GB
简介: php执行语句在MySQL批量插入大数据量的解决方案及计算程序执行时间(大数据量、MySQL语句优化)

前言

近期在MySQL报表开发过程中,需要爬取多API返回JSON数据,然后插入到数据库中。因不同API的返回时间、返回数据、返回格式、插入数据表等因素各不相同。如果前期架构不完善,会导致服务器的直接崩溃,为此,做了下php+mysql的批量插入大数据量的测试工作。


一、PHP计算程序执行时间

microtime() 函数,返回当前 Unix 时间戳的微秒数,都是以秒为单位返回。

执行代码:

$start_time = microtime();
/*
 * 执行程序代码;
 * */
$end_time = microtime();
echo '执行时间为:' . ($end_time - $start_time)  . ' s';


原理:分别记录函数开始时间和结束时间,然后时间差就是函数执行的时间。

二、Mysql批量插入数据

1.INSERT INTO 语句

  • 向表格中插入新的行
INSERT INTO 表名称 VALUES (值1, 值2,....)
  • 指定所要插入数据的列
INSERT INTO table_name (列1, 列2,...) VALUES (值1, 值2,....)

2.批量插入大数据

  • Mysql插入少量数据的时候,一般用for循环:读取固定结构化的数据或JSON数据,通过遍历的方式插入;

上图是一次性插入3000条的测试数据。

2.1 使用循环$sql的方式


  • MySQL使用insert语句进行合并插入的,比如INSERT INTO user_info (name, age) VALUES (‘name1’, 18), (‘name2’, 19);表示一次插入两条数据。

执行代码:

$sql = ' INSERT INTO ' . $db->table('log') . ' (user_name,logs,equipment,log_time,log_ip) VALUES ("' . $data[$i][0] . '","' . $data[$i][1] . '","' . $data[$i][2] . '","' . $data[$i][3] . '","' . $data[$i][4] . '")';
$db->query($sql);


$sql = ' INSERT INTO ' . $db->table('log') . ' VALUES ("' . ($i + 1) . '","' . $data[$i][0] . '","' . $data[$i][1] . '","' . $data[$i][2] . '","' . $data[$i][3] . '","' . $data[$i][4] . '")';
 $db->query($sql);


执行结果:不仅未完成数据的全部插入,直接将服务器拖成了500 Internal Server Error 。

The server encountered an internal error or misconfiguration and was unable to complete your request.

Please contact the server administrator at admin@example.com to inform them of the time this error occurred, and the actions you performed just before this error.

More information about this error may be available in the server error log.

Additionally, a 500 Internal Server Error error was encountered while trying to use an ErrorDocument to handle the request.



2.2 循环(值1, 值2,…)的语句

  • 执行效率奇高;
  • 对服务器的压力可以忽略不计;
  • 批量插入大数据量MySQL的优化,推荐本方案;
  • 大数据量插入mysql的语句(执行时间)★★★


 //批量添加数据;
    public function addData()
    {
        global $db;
        dbc();
        $start_time = microtime();//开始时间
        require_once 'data.php';//默认数据
        $sql = 'INSERT INTO ' . $db->table('log') . ' (user_name,logs,equipment,log_time,log_ip) VALUES ';
        for ($i = 0; $i < count($data); $i++) {
            $itemStr = '("';
            $itemStr .= $data[$i][0] . '","' . $data[$i][1] . '","' . $data[$i][2] . '","' . $data[$i][3] . '","' . $data[$i][4];
            $itemStr .= '"),';
            //echo $itemStr;
            $sql .= $itemStr;
        }
        $sql = rtrim($sql, ',');//去除最后一个逗号,并且加上结束分号
        $sql .= ';';
        $db->query($sql);
        $end_time = microtime();//结束时间
        $res["time"] = '执行时间:' . ($end_time - $start_time) . 's';
        $res["data"] = "数据录入完毕.";
        die(json_encode_lockdata($res));
    }
  • 实际开发取消时间验证★★★
 //批量添加数据;
    public function addData()
    {
        global $db;
        dbc();
        require_once 'data.php';//默认数据
        $sql = 'INSERT INTO ' . $db->table('log') . ' (user_name,logs,equipment,log_time,log_ip) VALUES ';
        for ($i = 0; $i < count($data); $i++) {
            $itemStr = '("';
            $itemStr .= $data[$i][0] . '","' . $data[$i][1] . '","' . $data[$i][2] . '","' . $data[$i][3] . '","' . $data[$i][4];
            $itemStr .= '"),';
            //echo $itemStr;
            $sql .= $itemStr;
        }
        $sql = rtrim($sql, ',');//去除最后一个逗号,并且加上结束分号
        $sql .= ';';
        $db->query($sql);
        $res["data"] = "数据录入完毕.";
        die(json_encode_lockdata($res));
    }


  • 拼接语句
 for ($i = 0; $i < count($data); $i++) {
            $itemStr = '(';
            $itemStr .= $data[$i][0] . ',' . $data[$i][1] . ',' . $data[$i][2] . ',' . $data[$i][3] . ',' . $data[$i][4];
            $itemStr .= '),';
            //echo $itemStr;
            $sql .= $itemStr;
        }


2.3测试过程出现的错误

“Unknown column ‘xxx’ in 'where clause


主要意思就是这个字段不存在,但实际情况有可能插入字段符合规范导致的。比如:username字段是varchar类型,而变量解析之后由于不带单引号,在PHP里面虽然可以当成字符串用,但执行sql语句就不符合Mysql的规范了。

错误的写法1:

 $sql = ' INSERT INTO ' . $db->table('log') . ' (user_name,logs,equipment,log_time,log_ip) VALUES (' . $data[$i][0] . ',' . $data[$i][1] . ',' . $data[$i][2] . ',' . $data[$i][3] . ',' . $data[$i][4] . ')';
$db->query($sql);


错误的写法2:

 $sql = ' INSERT INTO ' . $db->table('log') . ' (user_name,logs,equipment,log_time,log_ip) VALUES ($data[$i][0],$data[$i][1],$data[$i][2],$data[$i][3],$data[$i][4])';
$db->query($sql);


SQL语句错误号:Column count doesn’t match value count at row 1


SQL语句错误号:You have an error in your SQL syntax; check the manual that

corresponds to your MySQL server version for the right syntax to use

near ‘.162.76),(NO.0000007,10,LOCKDATAV机器人模拟数据-SHELL,1681302901,无法’ at

line 1


上面的错误,基本上都是因文本没有加引号导致的。


三、实战PHPExcel批量导入大数据量优化

循环读取excel表格,读取一条,插入一条,需要每次都连接数据库,执行效率比较低下。

 //循环读取excel表格,读取一条,插入一条
        //j表示从哪一行开始读取  从第二行开始读取,因为第一行是标题不保存
        //$a表示列号
        for ($j = 2; $j <= $highestRow; $j++) {
            $user_province = $objPHPExcel->getActiveSheet()->getCell("A" . $j)->getValue();
            $user_city = $objPHPExcel->getActiveSheet()->getCell("B" . $j)->getValue();
            $user_area = $objPHPExcel->getActiveSheet()->getCell("C" . $j)->getValue();
            $user_depart = $objPHPExcel->getActiveSheet()->getCell("D" . $j)->getValue();
            $user_titles = $objPHPExcel->getActiveSheet()->getCell("E" . $j)->getValue();
            $user_name = $objPHPExcel->getActiveSheet()->getCell("F" . $j)->getValue();
            $user_phone = $objPHPExcel->getActiveSheet()->getCell("G" . $j)->getValue();
            $user_pwd = $objPHPExcel->getActiveSheet()->getCell("H" . $j)->getValue();
            $user_auth = $objPHPExcel->getActiveSheet()->getCell("I" . $j)->getValue();
            //判断手机号重名;
            $row = $db->fetch('user', 'user_phone', array('user_phone' => trim($user_phone)), ' user_id DESC');
            if ($row) {
                $res['code'] = '0';
                $res['msg'] = $user_phone . '系统已存在,删除后重新导入';
                die(json_encode_lockdata($res));
            }
            //数据入库;
            if ($user_phone) {
 $db->insert('user', array('user_province' => $user_province, 'user_city' => $user_city, 'user_area' => $user_area, 'user_depart' => $user_depart, 'user_titles' => $user_titles,'user_name' => $user_name, 'user_phone' => $user_phone, 'user_pwd' => md5($user_pwd), 'user_auth' => $user_auth));
            }
        }
        $res['code'] = '1';
        $res['msg'] = '文件已导入数据库!';
        die(json_encode_lockdata($res));


升级后的代码:

 global $db;
        dbc();
        $sql = 'INSERT INTO ' . $db->table('user') . ' (user_province,user_city,user_area,user_depart,user_titles,user_name,user_phone,user_pwd,user_auth) VALUES ';
        for ($j = 2; $j <= $highestRow; $j++) {
            $user_province = $objPHPExcel->getActiveSheet()->getCell("A" . $j)->getValue();
            $user_city = $objPHPExcel->getActiveSheet()->getCell("B" . $j)->getValue();
            $user_area = $objPHPExcel->getActiveSheet()->getCell("C" . $j)->getValue();
            $user_depart = $objPHPExcel->getActiveSheet()->getCell("D" . $j)->getValue();
            $user_titles = $objPHPExcel->getActiveSheet()->getCell("E" . $j)->getValue();
            $user_name = $objPHPExcel->getActiveSheet()->getCell("F" . $j)->getValue();
            $user_phone = $objPHPExcel->getActiveSheet()->getCell("G" . $j)->getValue();
            $user_pwd = $objPHPExcel->getActiveSheet()->getCell("H" . $j)->getValue();
            $user_auth = $objPHPExcel->getActiveSheet()->getCell("I" . $j)->getValue();
            //判断手机号重名;
            $row = $db->fetch('user', 'user_phone', array('user_phone' => trim($user_phone)), ' user_id DESC');
            if ($row) {
                $res['code'] = '0';
                $res['msg'] = $user_phone . '系统已存在,删除后重新导入';
                die(json_encode_lockdata($res));
            }
            //数据入库;
            $itemStr = '("';
            $itemStr .= $user_province . '","' . $user_city . '","' . $user_area . '","' . $user_depart . '","' . $user_titles . '","' . $user_name . '","' . $user_phone . '","' . md5($user_pwd) . '","' . $user_auth;
            $itemStr .= '"),';
            $sql .= $itemStr;
        }
        $sql = rtrim($sql, ',') . ";";
        $db->query($sql);
        $res['code'] = '1';
        $res['msg'] = '文件已导入数据库!';
        die(json_encode_lockdata($res));
    }

如在上传过程过程中出现错误,请务必核对插入列数是否前后一致即可。

@漏刻有时


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
存储 关系型数据库 MySQL
大数据新视界--大数据大厂之MySQL 数据库课程设计:开启数据宇宙的传奇之旅
本文全面剖析数据库课程设计 MySQL,展现其奇幻魅力与严峻挑战。通过实际案例凸显数据库设计重要性,详述数据安全要点及学习目标。深入阐述备份与恢复方法,并分享优秀实践项目案例。为开发者提供 MySQL 数据库课程设计的全面指南,助力提升数据库设计与管理能力,保障数据安全稳定。
大数据新视界--大数据大厂之MySQL 数据库课程设计:开启数据宇宙的传奇之旅
|
11月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
6月前
|
数据采集 人工智能 程序员
PHP 程序员如何为 AI 浏览器(如 ChatGPT Atlas)优化网站
OpenAI推出ChatGPT Atlas,标志AI浏览器新方向。虽未颠覆现有格局,但为开发者带来新机遇。PHP建站者需关注AI爬虫抓取特性,优化技术结构(如SSR、Schema标记)、提升内容可读性与语义清晰度,并考虑未来agent调用能力。通过robots.txt授权、结构化数据、内容集群与性能优化,提升网站在AI搜索中的可见性与引用机会,提前布局AI驱动的流量新格局。
350 8
|
7月前
|
PHP 开发者
PHP计算过去一定时间段内日期范围函数
这个函数为开发者提供了一个快速而简单的方法来获取与当前日期相关的过去时间范围,代码简洁易懂,可复用性高。
195 15
|
7月前
|
关系型数据库 MySQL PHP
PHP和Mysql前后端交互效果实现
本文介绍了使用PHP连接MySQL数据库的基本函数及其实现案例。内容涵盖数据库连接、选择数据库、执行查询、获取结果等常用操作,并通过用户登录和修改密码的功能实例,展示了PHP与MySQL的交互过程及代码实现。
434 0
PHP和Mysql前后端交互效果实现
|
11月前
|
存储 关系型数据库 MySQL
大数据新视界 --面向数据分析师的大数据大厂之 MySQL 基础秘籍:轻松创建数据库与表,踏入大数据殿堂
本文详细介绍了在 MySQL 中创建数据库和表的方法。包括安装 MySQL、用命令行和图形化工具创建数据库、选择数据库、创建表(含数据类型介绍与选择建议、案例分析、最佳实践与注意事项)以及查看数据库和表的内容。文章专业、严谨且具可操作性,对数据管理有实际帮助。
大数据新视界 --面向数据分析师的大数据大厂之 MySQL 基础秘籍:轻松创建数据库与表,踏入大数据殿堂
|
关系型数据库 MySQL 数据安全/隐私保护
大数据新视界--大数据大厂之MySQL 数据库课程设计:数据安全深度剖析与未来展望
本文深入探讨数据库课程设计 MySQL 的数据安全。以医疗、电商、企业案例,详述用户管理、数据加密、备份恢复及网络安全等措施,结合数据安全技术发展趋势,与《大数据新视界 -- 大数据大厂之 MySQL 数据库课程设计》紧密关联,为 MySQL 数据安全提供全面指南。
大数据新视界--大数据大厂之MySQL 数据库课程设计:数据安全深度剖析与未来展望
|
关系型数据库 MySQL Linux
查看Linux、Apache、MySQL、PHP版本的技巧
以上就是查看Linux、Apache、MySQL、PHP版本信息的方法。希望这些信息能帮助你更好地理解和使用你的LAMP技术栈。
545 17
|
12月前
|
负载均衡 算法 关系型数据库
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL集群架构负载均衡故障排除与解决方案
本文深入探讨 MySQL 集群架构负载均衡的常见故障及排除方法。涵盖请求分配不均、节点无法响应、负载均衡器故障等现象,介绍多种负载均衡算法及故障排除步骤,包括检查负载均衡器状态、调整算法、诊断修复节点故障等。还阐述了预防措施与确保系统稳定性的方法,如定期监控维护、备份恢复策略、团队协作与知识管理等。为确保 MySQL 数据库系统高可用性提供全面指导。
|
SQL 关系型数据库 MySQL
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL 数据库 SQL 语句调优方法详解(2-1)
本文深入介绍 MySQL 数据库 SQL 语句调优方法。涵盖分析查询执行计划,如使用 EXPLAIN 命令及理解关键指标;优化查询语句结构,包括避免子查询、减少函数使用、合理用索引列及避免 “OR”。还介绍了索引类型知识,如 B 树索引、哈希索引等。结合与 MySQL 数据库课程设计相关文章,强调 SQL 语句调优重要性。为提升数据库性能提供实用方法,适合数据库管理员和开发人员。

推荐镜像

更多