我们在使用pymysql执行mysql语句的时候,可以使用批量插入的功能,例如我要插入如下三条内容到表test中:
name: kingname, salary:99999, phone_number:1234567 name: 王小二, salary:0, phone_number:7865432 name: 张小三, salary:44444, phone_number:88997766
那么我用Python插入数据,可以写为:
import pymysql connection = pymysql.connect(host='localhost', user='user', password='passwd', db='db', charset='utf8mb4', cursorclass=pymysql.cursors.DictCursor) with connection.cursor() as cursor: sql = 'insert into test (`name`, `salary`, `phone_number`) values (%s, %s, %s)' params = [('kingname', 99999, 1234567), ('王小二', 0, 7865432), ('张小三', 44444, 88997766)] cursor.executemany(sql, params) connection.commit()
正常情况下这样插入是没有问题的。但是,如果字段 phone_number
是一个 unique
字段,这样插入就会导致报错。现在的需求是,如果phone_number重复,那么就直接覆盖 name
和 salary
字段。于是,你可能会想着把MySQL写成这样:
with connection.cursor() as cursor: sql = 'insert into test (`name`, `salary`, `phone_number`) values (%s, %s, %s) on duplicate key update name=%s, salary=%s' params = [('kingname', 99999, 1234567, 'kingname', 99999), ('王小二', 0, 7865432, '王小二', 0), ('张小三', 44444, 88997766, '张小三', 44444)] cursor.executemany(sql, params) connection.commit()
你可以尝试一下,只要params超过两条数据,一定会报错。
这个原因在于,在批量执行的时候,只有前面的3个参数会使用多个变量,而update后面的两个%s并不会被批量执行。此时,正确的执行语句应该是:
with connection.cursor() as cursor: sql = 'insert into test (`name`, `salary`, `phone_number`) values (%s, %s, %s) on duplicate key update name=values(name), salary=values(salary)' params = [('kingname', 99999, 1234567), ('王小二', 0, 7865432), ('张小三', 44444, 88997766)] cursor.executemany(sql, params) connection.commit()