MySQL分页排序时数据重复问题

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: MySQL分页排序时数据重复问题分析

问题版本


MySQL 5.6


问题复现


首先,创建一张表,记录的是用户信息,id是主键,其他为业务字段。


CREATE TABLE `account_info` (

 `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',

 `seq` bigint(20) unsigned DEFAULT NULL COMMENT '序号',

 `userId` varchar(64) NOT NULL COMMENT '用户ID',

 `amount` decimal(10,3) unsigned NOT NULL COMMENT '余额',

 PRIMARY KEY (`id`),

 KEY `I_PIN` (`userId`),

 KEY `I_SEQ` (`seq`)

) ENGINE=InnoDB AUTO_INCREMENT=13 DEFAULT CHARSET=utf8


插入测试数据如下,


  • id、seq是数值类型保持自增的差异性
  • userId是字符类型保持差异性
  • amount是数值类型保持数据一致性。
    网络异常,图片无法展示
    |

    执行SQL查询第1页数据SELECT * FROM account_info ORDER BY amount DESC LIMIT 0,5,结果如下:
    网络异常,图片无法展示
    |

    执行SQL查询第2页数据SELECT * FROM account_info ORDER BY amount DESC LIMIT 5,5,结果如下:
    网络异常,图片无法展示
    |

    综上可以看到,id为2、3、4、5的数据在第1、2页均出现了,这便是我们所说的MySQL在排序+分页过程中可能出现的数据重复问题。


问题分析


排序算法优化


MySQL 5.6的版本上,优化器在遇到order by x limit m,n语句的时使用priority queue进行了优化。


网络异常,图片无法展示
|


使用优先级队列priority queue的目的,就是在不能使用索引有序性的时候,如果要排序,并且使用了limit n,那么只需要在排序的过程中,保留n条记录即可,这样虽然不能解决所有记录都需要排序的开销,但是只需要少量的内存就可以完成排序,也就是说优先级队列priority queue中只保留需要的最终返回的limit n即可。


堆排序不稳定性


网络异常,图片无法展示
|


之所以MySQL 5.6出现了第二页数据重复的问题,是因为priority queue使用了堆排序的排序方法,而堆排序是一个不稳定的排序方法,也就是相同的值可能排序出来的结果和读出来的数据顺序不一致。


排序场景


不使用order by条件的排序


SELECT * FROM account_info LIMIT 0,5


网络异常,图片无法展示
|

不使用 order by 条件时,默认使用 主键 进行排序,因此查询分页也是具有有序性,不存在数据重复的问题


使用order by条件分页的排序


使用有序性字段


使用唯一索引、不重复数据字段排序,不会出现分页重复数据情况


SELECT * FROM account_info ORDER BY userId LIMIT 0,5


使用非有序性字段


使用重复数据字段排序,会出现分页重复数据情况


SELECT * FROM account_info ORDER BY amount LIMIT 0,5


总结


汇总分页情况下的排序条件如下:

分页排序字段

排序字段是否数据唯一

排序字段是否有序

分页重复数据

主键

唯一索引

普通字段

普通字段

普通字段

普通字段


可以得到结论是,分页重复数据是否出现与排序字段数据唯一性有关,与排序字段是否有序无关,换句话说,只要排序字段的数据能够保证唯一性(如主键、唯一索引、不重复的普通字段),那么分页就不会存在重复数据,否则会有可能出现重复数据在不同分页中。


解决方法


使用或结合数据唯一的字段进行排序


网络异常,图片无法展示
|


SELECT * FROM account_info order by id LIMIT 0,5

SELECT * FROM account_info order by amount,id LIMIT 0,5


结合使用数据唯一的字段,将原本不唯一的排序条件变成组合唯一的排序条件,因此可以解决分页数据重复的问题


参考

MySQL分页时使用 limit+order by 会出现数据重复问题

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11天前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
本文介绍了MySQL InnoDB存储引擎中的数据文件和重做日志文件。数据文件包括`.ibd`和`ibdata`文件,用于存放InnoDB数据和索引。重做日志文件(redo log)确保数据的可靠性和事务的持久性,其大小和路径可由相关参数配置。文章还提供了视频讲解和示例代码。
118 11
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
|
11天前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
在项目中,为了解决Redis与Mysql的数据一致性问题,我们采用了多种策略:对于低一致性要求的数据,不做特别处理;时效性数据通过设置缓存过期时间来减少不一致风险;高一致性但时效性要求不高的数据,利用MQ异步同步确保最终一致性;而对一致性和时效性都有高要求的数据,则采用分布式事务(如Seata TCC模式)来保障。
46 14
|
14天前
|
SQL 前端开发 关系型数据库
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
46 9
|
21天前
|
SQL NoSQL 关系型数据库
2024Mysql And Redis基础与进阶操作系列(5)作者——LJS[含MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页等详解步骤及常见报错问题所对应的解决方法]
MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页、INSERT INTO SELECT / FROM查询结合精例等详解步骤及常见报错问题所对应的解决方法
|
25天前
|
SQL Java 关系型数据库
java连接mysql查询数据(基础版,无框架)
【10月更文挑战第12天】该示例展示了如何使用Java通过JDBC连接MySQL数据库并查询数据。首先在项目中引入`mysql-connector-java`依赖,然后通过`JdbcUtil`类中的`main`方法实现数据库连接、执行SQL查询及结果处理,最后关闭相关资源。
|
22天前
|
SQL 关系型数据库 MySQL
定时任务频繁插入数据导致锁表问题 -> 查询mysql进程
定时任务频繁插入数据导致锁表问题 -> 查询mysql进程
40 1
|
23天前
|
SQL 关系型数据库 MySQL
mysql数据误删后的数据回滚
【11月更文挑战第1天】本文介绍了四种恢复误删数据的方法:1. 使用事务回滚,通过 `pymysql` 库在 Python 中实现;2. 使用备份恢复,通过 `mysqldump` 命令备份和恢复数据;3. 使用二进制日志恢复,通过 `mysqlbinlog` 工具恢复特定位置的事件;4. 使用延迟复制从副本恢复,通过停止和重启从库复制来恢复数据。每种方法都有详细的步骤和示例代码。
|
分布式计算 关系型数据库 MySQL
E-Mapreduce如何处理RDS的数据
目前网站的一些业务数据存在了数据库中,这些数据往往需要做进一步的分析,如:需要跟一些日志数据关联分析,或者需要进行一些如机器学习的分析。在阿里云上,目前E-Mapreduce可以满足这类进一步分析的需求。
4971 0
|
10天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
25 1
|
12天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
28 4