MySQL中的ROW_NUMBER窗口函数简单了解下

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: ROW_NUMBER是 MySQL8引入的窗口函数之一,它为查询结果集中的每一行分配一个唯一的顺序号(行号)。ROW_NUMBER在分页、去重、分组内排序等场景中非常有用。

ROW_NUMBER() 是 MySQL8引入的窗口函数之一,它为查询结果集中的每一行分配一个唯一的顺序号(行号)。这个顺序号是基于窗口函数的 ORDER BY 子句进行排序的,可以根据指定的排序顺序生成连续的整数值。

ROW_NUMBER() 在分页、去重、分组内排序等场景中非常有用。

本文涉及到的脚本测试请在个人测试库进行。

使用场景

  • 分页查询:使用 ROW_NUMBER() 可以生成每行的序号,结合 WHERELIMIT 子句实现高效的分页查询。尤其是在没有 OFFSET 支持的情况下,ROW_NUMBER() 允许你在分页时进行灵活的排序。
  • 去除重复数据:可以利用 ROW_NUMBER() 来给每一行打上唯一标识,之后选择每组的第一行,从而有效地去除重复数据。
  • 分组内排序:可以按组对数据进行排序,并为每个组中的行分配一个行号。这个场景通常用于比如给每个订单中的商品按价格排序,并为每个订单挑选排名第一的商品。
  • 数据排名:使用 ROW_NUMBER() 可以为查询结果中的数据进行排名,适用于例如学生成绩排名、销售业绩排名等场景。

语法

ROW_NUMBER() OVER (PARTITION BY partition_expression ORDER BY order_expression) AS row_num
  • PARTITION BY:可选,按指定字段分组。相同分组内的行号会重新从 1 开始。
  • ORDER BY:指定排序字段,行号的生成顺序由此决定。

示例

假设有一个电商数据库,包含 ordersorder_items 表,使用 ROW_NUMBER() 来展示几种常见场景。


示例 1:为每个订单中的商品按价格排名

可以为每个订单中的商品按价格进行排序,并为每个商品分配一个排名。

-- 创建 orders 表
CREATE TABLE orders (
    order_id INT AUTO_INCREMENT PRIMARY KEY,
    customer_name VARCHAR(100),
    order_date DATE
);

-- 创建 order_items 表
CREATE TABLE order_items (
    order_item_id INT AUTO_INCREMENT PRIMARY KEY,
    order_id INT,
    product_name VARCHAR(100),
    quantity INT,
    unit_price DECIMAL(10, 2),
    FOREIGN KEY (order_id) REFERENCES orders(order_id)
);

-- 插入数据
INSERT INTO orders (customer_name, order_date) VALUES
('Alice', '2024-10-01'),
('Bob', '2024-10-02'),
('Charlie', '2024-10-03');

INSERT INTO order_items (order_id, product_name, quantity, unit_price) VALUES
(1, 'Laptop', 1, 1000.00),
(1, 'Phone', 2, 500.00),
(1, 'Tablet', 1, 300.00),
(2, 'Headphones', 2, 100.00),
(2, 'Mouse', 1, 50.00),
(3, 'Smartwatch', 1, 150.00),
(3, 'Laptop', 1, 800.00);

查询:为每个订单中的商品按 unit_price 排序,给出排名

SELECT 
    oi.order_id, 
    oi.product_name, 
    oi.unit_price,
    ROW_NUMBER() OVER (PARTITION BY oi.order_id ORDER BY oi.unit_price DESC) AS `rank`
FROM order_items oi;

结果

order_id product_name unit_price rank
1 Laptop 1000.00 1
1 Phone 500.00 2
1 Tablet 300.00 3
2 Headphones 100.00 1
2 Mouse 50.00 2
3 Laptop 800.00 1
3 Smartwatch 150.00 2

在这个例子中,使用 ROW_NUMBER() 按照每个 order_id 对商品按 unit_price 从高到低排序,并为每个商品分配了一个行号(排名)。

如果只想获取每个订单中价格最高的商品,可以在查询外层再加一个 WHERE rank = 1 来筛选。


示例 2:去除重复数据

假设 order_items 表中有重复的记录,可以利用 ROW_NUMBER() 给每一行编号,然后只保留每组中第一个出现的记录(行号为 1)。

插入重复数据

INSERT INTO order_items (order_id, product_name, quantity, unit_price) VALUES
(1, 'Laptop', 1, 1000.00),  -- 重复记录
(2, 'Mouse', 1, 50.00),     -- 重复记录
(3, 'Smartwatch', 1, 150.00);

查询:去除重复记录

WITH ranked_items AS (
    SELECT 
        oi.order_item_id, 
        oi.order_id, 
        oi.product_name, 
        oi.unit_price,
        ROW_NUMBER() OVER (PARTITION BY oi.order_id, oi.product_name ORDER BY oi.order_item_id) AS rn
    FROM order_items oi
)
SELECT 
    order_item_id, 
    order_id, 
    product_name, 
    unit_price
FROM ranked_items
WHERE rn = 1;
order_item_id order_id product_name unit_price
1 1 Laptop 1000.00
2 1 Phone 500.00
3 1 Tablet 300.00
4 2 Headphones 100.00
5 2 Mouse 50.00
7 3 Laptop 800.00
6 3 Smartwatch 150.00

在这个查询中,ROW_NUMBER() 根据 order_idproduct_name 为每一组商品打上编号,PARTITION BY 确保每个订单中同一个商品只保留一次。WHERE rn = 1 确保每个分组只保留第一条记录,从而去除了重复的商品条目。

示例 3:分页查询

假设需要分页展示订单项,每页展示 2 条数据。可以使用 ROW_NUMBER() 来为查询结果生成行号,并结合 WHERE 子句限制显示特定页的数据。

查询:分页显示第二页数据(每页显示 2 条)

WITH ranked_items AS (
    SELECT 
        oi.order_item_id, 
        oi.order_id, 
        oi.product_name, 
        oi.unit_price,
        ROW_NUMBER() OVER (ORDER BY oi.order_item_id) AS rn
    FROM order_items oi
)
SELECT 
    order_item_id, 
    order_id, 
    product_name, 
    unit_price
FROM ranked_items
WHERE rn BETWEEN 3 AND 4;

结果

order_item_id order_id product_name unit_price
3 1 Tablet 300.00
4 2 Headphones 100.00

在这个分页查询中,ROW_NUMBER() 为查询结果集中的每一行分配了一个行号,然后通过 WHERE rn BETWEEN 3 AND 4 获取第 2 页的结果(假设每页 2 条数据)。

总结

ROW_NUMBER() 在 MySQL 中是一个强大的窗口函数,具有以下几个主要用途:

  • 分页查询:通过生成行号来实现高效分页。
  • 去重:利用分组和行号,可以去除重复数据。
  • 分组排序:对每个分组内的数据进行排序并生成排名。
  • 数据排名:计算排名或为数据按某种规则分配顺序。

MySQL 8.0 引入的窗口函数使得许多复杂的查询变得更加简洁和高效,特别是在处理排名、去重和分页等场景时。

关于作者

来自全栈程序员nine的探索与实践,持续迭代中。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
27天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
68 11
|
2月前
|
SQL 关系型数据库 MySQL
MySQL8 窗口函数
MySQL 8 引入了窗口函数,这是一种强大的分析工具,可以在查询结果集中执行计算而无需将数据分组到多个输出行中。本文介绍了窗口函数的基本概念和使用方法,并通过几个实际案例展示了如何使用窗口函数进行成绩和排名统计、销售数据分析等操作。
MySQL8 窗口函数
|
8月前
|
SQL 关系型数据库 MySQL
MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
157 0
|
7月前
|
关系型数据库 MySQL 数据挖掘
MySQL窗口函数:原理和使用
MySQL窗口函数:原理和使用
|
7月前
|
关系型数据库 MySQL 数据挖掘
MySQL窗口函数详解(概念+练习+实战)
MySQL窗口函数详解(概念+练习+实战)
1323 1
|
7月前
|
关系型数据库 MySQL
【随手记】MySQL中ROW_NUMBER()、RANK()和DENSE_RANK()函数的用法
【随手记】MySQL中ROW_NUMBER()、RANK()和DENSE_RANK()函数的用法
235 1
|
7月前
|
关系型数据库 MySQL
MYSQL 窗口函数
MYSQL 窗口函数
|
7月前
|
关系型数据库 MySQL 数据挖掘
MySQL 8窗口函数详解:高效数据处理的必备技能
MySQL 8窗口函数详解:高效数据处理的必备技能
297 3
|
8月前
|
SQL Oracle 关系型数据库
MySQL窗口函数怎么用
这段内容介绍了如何使用窗口函数(Window Function)在 MySQL 8.x 中进行更高效、简洁的数据分析和计算。窗口函数允许我们在查询结果集的特定窗口(或分区)内执行计算,如聚合、排序和行号生成。文章以一个复杂的 SQL 查询作为示例,展示了如何使用窗口函数简化这个计算排名的过程。