mysql大批量插入数据的正确做法

2023-09-16 154

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，高可用系列 2核4GB

简介： mysql大批量插入数据的正确做法

1 批量插入和单条插入比较

如何快速的向数据库中插入已知的1000万条数据

假设这1000W条数据在同一个集合里，那么将这个集合进行遍历，循环1000W次，结合数据库编程技术，如JDBC，就可以插入数据库，这么简单的操作，显然不是正确答案…

List<User> list = findAllUser();
Statement stat = conn.createStatement();
for (User u : list) {
  String sql = "INSERT INTO t_user (uname,age,email) VALUE ('"
                  +u.getUsername()+"',"+u.getAge()+",'"+u.getEmail()+"')";
  stat.addBatch(sql);
}
stat.executeBatch();
INSERT INTO t_user
      (uname,upwd,age,email)
VALUE 
      ('root1','123456',15,'root111@qq.com'),
      ('root2','123456',18,'root222@qq.com')，
      ('root3','123456',26,'root333@qq.com')，
      ....

当两种方法配合使用，可以使用每条SQL语句插入100条数据，批处理每次发送1000条这样的数据，共循环100次即可。

理论上来说，批处理操作不建议一次性超过【5000】，每条SQL语句根据具体需求调整，不建议超过【100】，可以调整循环次数来改善效率。

下面为测试代码：

1.1 测试普通插入

@Test
public void testInsert() {
  UserDAO dao = new UserDAO();
  long t1 = System.currentTimeMillis();
  for(int i=0;i<10000000;i++) {
      dao.insert(
                "INSERT INTO t_user (uname,pwd,age,email) VALUES ('root','123',15,'root@qq.com')");
  }
  long t2 = System.currentTimeMillis();
  int time = (int) ((t2-t1)/1000);
  System.out.println("共耗时：" + time +"秒")
}

测试结果：

在尝试了几次，都被各种意外打断之后，我决定没有必要把数据全部插完，因为实在是太多了，不多说，上图吧

1.2 测试批处理配合拼接SQL语句插入

@Test
public void testBatch() throws SQLException {
  Connection conn = DBUtils.getConn();
  Statement stat = conn.createStatement();
long t1 = System.currentTimeMillis();
  for(int k=0;k<100;k++) {
  for (int i=0;i<1000;i++) {
      StringBuilder sql =new StringBuilder();
      sql.append("INSERT INTO t_user (uname,pwd,age,email) VALUES ");
      for (int j = 0; j < 100; j++) {       sql.append("('root','123',15,'root@qq.com'),");
      }
      stat.addBatch(sql.toString().substring(0,sql.lastIndexOf(",")))
    }
    stat.executeBatch();
  }
  long t2 = System.currentTimeMillis();
  int time = (int) ((t2-t1)/1000);
  System.out.println("共耗时：" + time +"秒");
}

测试结果：

结果显而易见了：第二种方案的执行效率远高于普通插入方法，不过，具体运行时间和电脑配置应该也有关系的，所以不用纠结时间长短，还是会用高效的方法就好了。

2 原理探究

应用服务器（程序运行所在服务器）与MySQL数据库服务器并不是同一台，当需要执行数据库操作时，会由应用服务器将SQL语句发送到MySQL数据库服务器，发送过程中就需要建立网络连接，才可以发送SQL语句，则总共需要连接1000W次，效率极低。

同时，每次执行SQL语句之前，MySQL服务器还会对SQL语句进行语法分析，语义分析，编译检查等才可以执行，假设最终有1000W条SQL语句，则这些过程需要耗费大量时间。

针对这个缺陷，

可以使用【批处理】解决，减少连接数据库的次数，同时将单条插入语句改为一次插入多条数据以提高效率。

相关实践学习

如何在云端创建MySQL数据库

开始实验后，系统会自动创建一台自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS。

全面了解阿里云能为你做什么

阿里云在全球各地部署高效节能的绿色数据中心，利用清洁计算为万物互联的新世界提供源源不断的能源动力，目前开服的区域包括中国（华北、华东、华南、香港）、新加坡、美国（美东、美西）、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程，来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品：云服务器ECS 云服务器 ECS（Elastic Compute Service）是一种弹性可伸缩的计算服务，助您降低 IT 成本，提升运维效率，使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs

mysql大批量插入数据的正确做法

1 批量插入和单条插入比较

1.1 测试普通插入

1.2 测试批处理配合拼接SQL语句插入

2 原理探究

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

mysql大批量插入数据的正确做法

1 批量插入和单条插入比较

1.1 测试普通插入

1.2 测试批处理配合拼接SQL语句插入

2 原理探究

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像