Mysql数据库基础系列

案例数据提取码：2rd5

1.窗口函数

MySQL从8.0版本开始支持窗口函数。窗口函数的作用类似于在查询中对数据进行分组，不同的是，分组操作会把分组的结果聚合成一条记录，而窗口函数是将结果置于每一条数据记录中。

首先从一个简单的案例来理解窗口函数。为了更好的理解窗口函数的变化，本章代码在命令行窗口执行。

首先创建一个数据表，代表某网购平台在每个城市每个地区的销售情况

mysql> CREATE TABLE sales(
    -> id INT PRIMARY KEY AUTO_INCREMENT,
    -> city VARCHAR(15),
    -> county VARCHAR(15),
    -> sales_value DECIMAL
    -> );
INSERT INTO sales(city,county,sales_value)
VALUES
('北京','海淀',10.00),
('北京','朝阳',20.00),
('上海','黄埔',30.00),
('上海','长宁',10.00);


mysql> SELECT * FROM sales;

+----+------+--------+-------------+
| id | city | county | sales_value |
+----+------+--------+-------------+
|  1 | 北京 | 海淀   |          10 |
|  2 | 北京 | 朝阳   |          20 |
|  3 | 上海 | 黄埔   |          30 |
|  4 | 上海 | 长宁   |          10 |
+----+------+--------+-------------+
4 rows in set (0.01 sec)

下面，我们要查询这个网站在每个城市的销售总额、在全国的销售总额、每个区的销售额占所在城市销售额中的比率，以及占总销售额中的比率。
先用之前的分组和聚合函数
第一步，计算总销售额

CREATE TEMPORARY TABLE a #创建临时表
SELECT SUM(sales_value) AS sales_value #计算总计金额
FROM sales;
mysql> SELECT * FROM a;
+-------------+
| sales_value |
+-------------+
|          70 |
+-------------+
1 row in set (0.00 sec)

第二步，计算每个城市的销售额

create temporary table b #创建临时表
select city, sum(sales_value) as sales_value #计算城市总销售额 
from sales
group by city;

mysql> select * from b;
+------+-------------+
| city | sales_value |
+------+-------------+
| 北京 |          30 |
| 上海 |          40 |
+------+-------------+
2 rows in set (0.00 sec)

第三步，计算比例

SELECT s.city AS 城市,s.county AS 区,s.sales_value AS 区销售额,
b.sales_value AS 市销售额,s.sales_value/b.sales_value AS 市比率,
a.sales_value AS 总销售额,s.sales_value/a.sales_value AS 总比率
FROM sales s
JOIN b ON (s.city=b.city) -- 连接市统计结果临时表
JOIN a -- 连接总计金额临时表
ORDER BY s.city,s.county;

+------+------+----------+----------+--------+----------+--------+
| 城市 | 区   | 区销售额 | 市销售额 | 市比率 | 总销售额 | 总比率 |
+------+------+----------+----------+--------+----------+--------+
| 上海 | 长宁 |       10 |       40 | 0.2500 |       70 | 0.1429 |
| 上海 | 黄埔 |       30 |       40 | 0.7500 |       70 | 0.4286 |
| 北京 | 朝阳 |       20 |       30 | 0.6667 |       70 | 0.2857 |
| 北京 | 海淀 |       10 |       30 | 0.3333 |       70 | 0.1429 |
+------+------+----------+----------+--------+----------+--------+
4 rows in set (0.00 sec)

上述是不使用窗口函数的情况下所需要的代码，下面使用窗口函数。

SELECT city AS 城市,county AS 区,sales_value AS 区销售额,
SUM(sales_value) OVER(PARTITION BY city) AS 市销售额, -- 计算市销售额
sales_value/SUM(sales_value) OVER(PARTITION BY city) AS 市比率,
SUM(sales_value) OVER() AS 总销售额, -- 计算总销售额
sales_value/SUM(sales_value) OVER() AS 总比率
FROM sales
ORDER BY city,county;

使用窗口函数，只用了一步就完成了查询。而且，由于没有用到临时表，执行的效率也更高了。很显然，在这种需要用到分组统计的结果对每一条记录进行计算的场景下，使用窗口函数更好。

1.1窗口函数分类

窗口函数可以分为静态窗口函数和动态窗口函数。静态窗口函数的窗口大小是固定的，不会因为记录的不同而不同；动态窗口函数的窗口大小会随着记录的不同而变化。MySQL官方网站窗口函数的网址为https://dev.mysql.com/doc/refman/8.0/en/window-function-descriptions.html#function_row-number
具体分类如下：在这里插入图片描述

1.2 窗口函数的语法结构

# 方式1
函数 over([parition by 字段 order by 字段 asc|desc])
# 方式2
函数 OVER 窗口名 … WINDOW 窗口名 AS （[PARTITION BY 字段名 ORDER BY 字段名 ASC|DESC]）

OVER 关键字指定函数窗口的范围。

如果省略后面括号中的内容，则窗口会包含满足WHERE条件的所有记录，窗口函数会基于所有满足WHERE条件的记录进行计算。如果OVER关键字后面的括号不为空，则可以使用如下语法设置窗口。

窗口名：为窗口设置一个别名，用来标识窗口。
PARTITION BY子句：指定窗口函数按照哪些字段进行分组。分组后，窗口函数可以在每个分组中分别执行。
ORDER BY子句：指定窗口函数按照哪些字段进行排序。执行排序操作使窗口函数按照排序后的数据记录的顺序进行编号。
FRAME子句：为分区中的某个子集定义规则，可以用来作为滑动窗口使用。

首先，创建新的数据集来进行讲解

CREATE TABLE goods(
id INT PRIMARY KEY AUTO_INCREMENT,
category_id INT,
category VARCHAR(15),
NAME VARCHAR(30),
price DECIMAL(10,2),
stock INT,
upper_time DATETIME
);

INSERT INTO goods(category_id,category,NAME,price,stock,upper_time)
VALUES
(1, '女装/女士精品', 'T恤', 39.90, 1000, '2020-11-10 00:00:00'),
(1, '女装/女士精品', '连衣裙', 79.90, 2500, '2020-11-10 00:00:00'),
(1, '女装/女士精品', '卫衣', 89.90, 1500, '2020-11-10 00:00:00'),
(1, '女装/女士精品', '牛仔裤', 89.90, 3500, '2020-11-10 00:00:00'),
(1, '女装/女士精品', '百褶裙', 29.90, 500, '2020-11-10 00:00:00'),
(1, '女装/女士精品', '呢绒外套', 399.90, 1200, '2020-11-10 00:00:00'),
(2, '户外运动', '自行车', 399.90, 1000, '2020-11-10 00:00:00'),
(2, '户外运动', '山地自行车', 1399.90, 2500, '2020-11-10 00:00:00'),
(2, '户外运动', '登山杖', 59.90, 1500, '2020-11-10 00:00:00'),
(2, '户外运动', '骑行装备', 399.90, 3500, '2020-11-10 00:00:00'),
(2, '户外运动', '运动外套', 799.90, 500, '2020-11-10 00:00:00'),
(2, '户外运动', '滑板', 499.90, 1200, '2020-11-10 00:00:00');
 select * from goods;
+----+-------------+---------------+------------+---------+-------+---------------------+
| id | category_id | category      | NAME       | price   | stock | upper_time          |
+----+-------------+---------------+------------+---------+-------+---------------------+
|  1 |           1 | 女装/女士精品 | T恤        |   39.90 |  1000 | 2020-11-10 00:00:00 |
|  2 |           1 | 女装/女士精品 | 连衣裙     |   79.90 |  2500 | 2020-11-10 00:00:00 |
|  3 |           1 | 女装/女士精品 | 卫衣       |   89.90 |  1500 | 2020-11-10 00:00:00 |
|  4 |           1 | 女装/女士精品 | 牛仔裤     |   89.90 |  3500 | 2020-11-10 00:00:00 |
|  5 |           1 | 女装/女士精品 | 百褶裙     |   29.90 |   500 | 2020-11-10 00:00:00 |
|  6 |           1 | 女装/女士精品 | 呢绒外套   |  399.90 |  1200 | 2020-11-10 00:00:00 |
|  7 |           2 | 户外运动      | 自行车     |  399.90 |  1000 | 2020-11-10 00:00:00 |
|  8 |           2 | 户外运动      | 山地自行车 | 1399.90 |  2500 | 2020-11-10 00:00:00 |
|  9 |           2 | 户外运动      | 登山杖     |   59.90 |  1500 | 2020-11-10 00:00:00 |
| 10 |           2 | 户外运动      | 骑行装备   |  399.90 |  3500 | 2020-11-10 00:00:00 |
| 11 |           2 | 户外运动      | 运动外套   |  799.90 |   500 | 2020-11-10 00:00:00 |
| 12 |           2 | 户外运动      | 滑板       |  499.90 |  1200 | 2020-11-10 00:00:00 |
+----+-------------+---------------+------------+---------+-------+---------------------+
12 rows in set (0.00 sec)

1.3 序号函数

1.3.1 row_number()函数

ROW_NUMBER()函数能够对数据中的序号进行顺序显示。但是相同的数据的排序不一致
举例：查询 goods 数据表中每个商品分类下价格降序排列的各个商品信息。

 SELECT ROW_NUMBER() OVER(PARTITION BY category_id ORDER BY price DESC) AS row_num,
    -> id, category_id, category, NAME, price, stock
    -> FROM goods;
mysql> SELECT ROW_NUMBER() OVER(PARTITION BY category_id ORDER BY price DESC) AS
    -> row_num,
    -> id, category_id, category, NAME, price, stock
    -> FROM goods;
+---------+----+-------------+---------------+------------+---------+-------+
| row_num | id | category_id | category      | NAME       | price   | stock |
+---------+----+-------------+---------------+------------+---------+-------+
|       1 |  6 |           1 | 女装/女士精品 | 呢绒外套   |  399.90 |  1200 |
|       2 |  3 |           1 | 女装/女士精品 | 卫衣       |   89.90 |  1500 |
|       3 |  4 |           1 | 女装/女士精品 | 牛仔裤     |   89.90 |  3500 |
|       4 |  2 |           1 | 女装/女士精品 | 连衣裙     |   79.90 |  2500 |
|       5 |  1 |           1 | 女装/女士精品 | T恤        |   39.90 |  1000 |
|       6 |  5 |           1 | 女装/女士精品 | 百褶裙     |   29.90 |   500 |
|       1 |  8 |           2 | 户外运动      | 山地自行车 | 1399.90 |  2500 |
|       2 | 11 |           2 | 户外运动      | 运动外套   |  799.90 |   500 |
|       3 | 12 |           2 | 户外运动      | 滑板       |  499.90 |  1200 |
|       4 |  7 |           2 | 户外运动      | 自行车     |  399.90 |  1000 |
|       5 | 10 |           2 | 户外运动      | 骑行装备   |  399.90 |  3500 |
|       6 |  9 |           2 | 户外运动      | 登山杖     |   59.90 |  1500 |
+---------+----+-------------+---------------+------------+---------+-------+
12 rows in set (0.00 sec)

可以看出对每个类型安装价格进行了排序，但是存在相同的价格但是他们的排序不一样，下面通过rank()函数和dense_rank()函数来解决这个问题

1.3.2 rank()函数

使用RANK()函数能够对序号进行并列排序，并且会跳过重复的序号。例如我们常见的排名系统：1、1、3
举例：使用RANK()函数获取 goods 数据表中各类别的价格从高到低排序的各商品信息。

mysql> SELECT RANK() OVER(PARTITION BY category_id ORDER BY price DESC) AS row_num,
    -> id, category_id, category, NAME, price, stock
    ->  FROM goods;
+---------+----+-------------+---------------+------------+---------+-------+
| row_num | id | category_id | category      | NAME       | price   | stock |
+---------+----+-------------+---------------+------------+---------+-------+
|       1 |  6 |           1 | 女装/女士精品 | 呢绒外套   |  399.90 |  1200 |
|       2 |  3 |           1 | 女装/女士精品 | 卫衣       |   89.90 |  1500 |
|       2 |  4 |           1 | 女装/女士精品 | 牛仔裤     |   89.90 |  3500 |
|       4 |  2 |           1 | 女装/女士精品 | 连衣裙     |   79.90 |  2500 |
|       5 |  1 |           1 | 女装/女士精品 | T恤        |   39.90 |  1000 |
|       6 |  5 |           1 | 女装/女士精品 | 百褶裙     |   29.90 |   500 |
|       1 |  8 |           2 | 户外运动      | 山地自行车 | 1399.90 |  2500 |
|       2 | 11 |           2 | 户外运动      | 运动外套   |  799.90 |   500 |
|       3 | 12 |           2 | 户外运动      | 滑板       |  499.90 |  1200 |
|       4 |  7 |           2 | 户外运动      | 自行车     |  399.90 |  1000 |
|       4 | 10 |           2 | 户外运动      | 骑行装备   |  399.90 |  3500 |
|       6 |  9 |           2 | 户外运动      | 登山杖     |   59.90 |  1500 |
+---------+----+-------------+---------------+------------+---------+-------+
12 rows in set (0.00 sec)

举例：使用RANK()函数获取 goods 数据表中类别为“女装/女士精品”的价格最高的4款商品信息。
还记得在使用聚合函数时，我们可以用having对聚合函数的结果进行条件筛选
在使用窗口函数时,having语法不适用，我们可以使用一个子查询来对窗口函数的结果进行筛选。

mysql> SELECT * FROM(
    -> SELECT RANK() OVER(PARTITION BY category_id ORDER BY price DESC) AS row_num,
    -> id, category_id, category, NAME, price, stock
    ->  FROM goods) t
    ->  WHERE category_id = 1
    ->  AND row_num <= 4;
+---------+----+-------------+---------------+----------+--------+-------+
| row_num | id | category_id | category      | NAME     | price  | stock |
+---------+----+-------------+---------------+----------+--------+-------+
|       1 |  6 |           1 | 女装/女士精品 | 呢绒外套 | 399.90 |  1200 |
|       2 |  3 |           1 | 女装/女士精品 | 卫衣     |  89.90 |  1500 |
|       2 |  4 |           1 | 女装/女士精品 | 牛仔裤   |  89.90 |  3500 |
|       4 |  2 |           1 | 女装/女士精品 | 连衣裙   |  79.90 |  2500 |
+---------+----+-------------+---------------+----------+--------+-------+
4 rows in set (0.00 sec)

可以看到排序的结果为1、2、2、4，下面我们用dense_rank()函数来看一下有什么区别。

1.3.3 dense_rank()函数

DENSE_RANK()函数对序号进行并列排序，并且不会跳过重复的序号，比如序号为1、1、2。
同样我们查询 goods 数据表中类别为“女装/女士精品”的价格最高的4款商品信息。

mysql>  SELECT * FROM(
    -> SELECT dense_RANK() OVER(PARTITION BY category_id ORDER BY price DESC) AS row_num,
    -> id, category_id, category, NAME, price, stock
    ->  FROM goods) t
    ->  WHERE category_id = 1
    ->  AND row_num <= 3;
+---------+----+-------------+---------------+----------+--------+-------+
| row_num | id | category_id | category      | NAME     | price  | stock |
+---------+----+-------------+---------------+----------+--------+-------+
|       1 |  6 |           1 | 女装/女士精品 | 呢绒外套 | 399.90 |  1200 |
|       2 |  3 |           1 | 女装/女士精品 | 卫衣     |  89.90 |  1500 |
|       2 |  4 |           1 | 女装/女士精品 | 牛仔裤   |  89.90 |  3500 |
|       3 |  2 |           1 | 女装/女士精品 | 连衣裙   |  79.90 |  2500 |
+---------+----+-------------+---------------+----------+--------+-------+
4 rows in set (0.00 sec)

看到排序结果为1、2、2、3

1.4 分布函数

1.4.1.percent_rank()函数

等级制百分比函数：(rank-1)/(rows-1)

rank是rank函数返回值，
rows是当前窗口总记录数

案例：计算 goods 数据表中名称为“女装/女士精品”的类别下的商品的PERCENT_RANK值

mysql> SELECT rank() over(PARTITION BY category_id ORDER BY price DESC) ar,
    -> percent_rank() over (PARTITION BY category_id ORDER BY price DESC) pr,
    -> id, category_id, category, NAME,price,stock
    -> FROM goods
    -> WHERE category_id = 1;
+----+-----+----+-------------+---------------+----------+--------+-------+
| ar | pr  | id | category_id | category      | NAME     | price  | stock |
+----+-----+----+-------------+---------------+----------+--------+-------+
|  1 |   0 |  6 |           1 | 女装/女士精品 | 呢绒外套 | 399.90 |  1200 |
|  2 | 0.2 |  3 |           1 | 女装/女士精品 | 卫衣     |  89.90 |  1500 |
|  2 | 0.2 |  4 |           1 | 女装/女士精品 | 牛仔裤   |  89.90 |  3500 |
|  4 | 0.6 |  2 |           1 | 女装/女士精品 | 连衣裙   |  79.90 |  2500 |
|  5 | 0.8 |  1 |           1 | 女装/女士精品 | T恤      |  39.90 |  1000 |
|  6 |   1 |  5 |           1 | 女装/女士精品 | 百褶裙   |  29.90 |   500 |
+----+-----+----+-------------+---------------+----------+--------+-------+
6 rows in set (0.00 sec)

1.4.2.cume_dist()函数

CUME_DIST()函数主要用于查询小于或等于某个值的比例

mysql> SELECT CUME_DIST() OVER(PARTITION BY category_id ORDER BY price ASC) AS cd,
    -> id, category, NAME, price
    -> FROM goods;
+---------------------+----+---------------+------------+---------+
| cd                  | id | category      | NAME       | price   |
+---------------------+----+---------------+------------+---------+
| 0.16666666666666666 |  5 | 女装/女士精品 | 百褶裙     |   29.90 |
|  0.3333333333333333 |  1 | 女装/女士精品 | T恤        |   39.90 |
|                 0.5 |  2 | 女装/女士精品 | 连衣裙     |   79.90 |
|  0.8333333333333334 |  3 | 女装/女士精品 | 卫衣       |   89.90 |
|  0.8333333333333334 |  4 | 女装/女士精品 | 牛仔裤     |   89.90 |
|                   1 |  6 | 女装/女士精品 | 呢绒外套   |  399.90 |
| 0.16666666666666666 |  9 | 户外运动      | 登山杖     |   59.90 |
|                 0.5 |  7 | 户外运动      | 自行车     |  399.90 |
|                 0.5 | 10 | 户外运动      | 骑行装备   |  399.90 |
|  0.6666666666666666 | 12 | 户外运动      | 滑板       |  499.90 |
|  0.8333333333333334 | 11 | 户外运动      | 运动外套   |  799.90 |
|                   1 |  8 | 户外运动      | 山地自行车 | 1399.90 |
+---------------------+----+---------------+------------+---------+
12 rows in set (0.00 sec)

1.5前后函数

1.5.1 lag(expr,n)函数

LAG(expr,n)函数返回当前行的前n行的expr的值。

举例：查询goods数据表中前一个商品价格与当前商品价格的差值

mysql> SELECT id, category, NAME, price, pre_price, price - pre_price AS diff_price
    -> FROM (
    -> SELECT id, category, NAME, price,LAG(price,1) OVER w AS pre_price
    -> FROM goods
    -> WINDOW w AS (PARTITION BY category_id ORDER BY price)) t;
+----+---------------+------------+---------+-----------+------------+
| id | category      | NAME       | price   | pre_price | diff_price |
+----+---------------+------------+---------+-----------+------------+
|  5 | 女装/女士精品 | 百褶裙     |   29.90 |      NULL |       NULL |
|  1 | 女装/女士精品 | T恤        |   39.90 |     29.90 |      10.00 |
|  2 | 女装/女士精品 | 连衣裙     |   79.90 |     39.90 |      40.00 |
|  3 | 女装/女士精品 | 卫衣       |   89.90 |     79.90 |      10.00 |
|  4 | 女装/女士精品 | 牛仔裤     |   89.90 |     89.90 |       0.00 |
|  6 | 女装/女士精品 | 呢绒外套   |  399.90 |     89.90 |     310.00 |
|  9 | 户外运动      | 登山杖     |   59.90 |      NULL |       NULL |
|  7 | 户外运动      | 自行车     |  399.90 |     59.90 |     340.00 |
| 10 | 户外运动      | 骑行装备   |  399.90 |    399.90 |       0.00 |
| 12 | 户外运动      | 滑板       |  499.90 |    399.90 |     100.00 |
| 11 | 户外运动      | 运动外套   |  799.90 |    499.90 |     300.00 |
|  8 | 户外运动      | 山地自行车 | 1399.90 |    799.90 |     600.00 |
+----+---------------+------------+---------+-----------+------------+
12 rows in set (0.00 sec)

1.5.2．LEAD(expr,n)函数

LEAD(expr,n)函数返回当前行的后n行的expr的值。
举例：查询goods数据表中后一个商品价格与当前商品价格的差值

mysql> SELECT id, category, NAME, behind_price, price,behind_price - price AS diff_price
    -> FROM(
    -> SELECT id, category, NAME, price,LEAD(price, 1) OVER w AS behind_price
    -> FROM goods WINDOW w AS (PARTITION BY category_id ORDER BY price)) t;
+----+---------------+------------+--------------+---------+------------+
| id | category      | NAME       | behind_price | price   | diff_price |
+----+---------------+------------+--------------+---------+------------+
|  5 | 女装/女士精品 | 百褶裙     |        39.90 |   29.90 |      10.00 |
|  1 | 女装/女士精品 | T恤        |        79.90 |   39.90 |      40.00 |
|  2 | 女装/女士精品 | 连衣裙     |        89.90 |   79.90 |      10.00 |
|  3 | 女装/女士精品 | 卫衣       |        89.90 |   89.90 |       0.00 |
|  4 | 女装/女士精品 | 牛仔裤     |       399.90 |   89.90 |     310.00 |
|  6 | 女装/女士精品 | 呢绒外套   |         NULL |  399.90 |       NULL |
|  9 | 户外运动      | 登山杖     |       399.90 |   59.90 |     340.00 |
|  7 | 户外运动      | 自行车     |       399.90 |  399.90 |       0.00 |
| 10 | 户外运动      | 骑行装备   |       499.90 |  399.90 |     100.00 |
| 12 | 户外运动      | 滑板       |       799.90 |  499.90 |     300.00 |
| 11 | 户外运动      | 运动外套   |      1399.90 |  799.90 |     600.00 |
|  8 | 户外运动      | 山地自行车 |         NULL | 1399.90 |       NULL |
+----+---------------+------------+--------------+---------+------------+
12 rows in set (0.00 sec)

1.6 其他函数

1.6.1 FIRST_VALUE(expr)函数

FIRST_VALUE(expr)函数返回第一个expr的值。
举例：按照价格排序，查询第1个商品的价格信息。

mysql> SELECT id, category, NAME, price, stock,FIRST_VALUE(price) OVER w AS
    -> first_price
    -> FROM goods WINDOW w AS (PARTITION BY category_id ORDER BY price);
+----+---------------+------------+---------+-------+-------------+
| id | category      | NAME       | price   | stock | first_price |
+----+---------------+------------+---------+-------+-------------+
|  5 | 女装/女士精品 | 百褶裙     |   29.90 |   500 |       29.90 |
|  1 | 女装/女士精品 | T恤        |   39.90 |  1000 |       29.90 |
|  2 | 女装/女士精品 | 连衣裙     |   79.90 |  2500 |       29.90 |
|  3 | 女装/女士精品 | 卫衣       |   89.90 |  1500 |       29.90 |
|  4 | 女装/女士精品 | 牛仔裤     |   89.90 |  3500 |       29.90 |
|  6 | 女装/女士精品 | 呢绒外套   |  399.90 |  1200 |       29.90 |
|  9 | 户外运动      | 登山杖     |   59.90 |  1500 |       59.90 |
|  7 | 户外运动      | 自行车     |  399.90 |  1000 |       59.90 |
| 10 | 户外运动      | 骑行装备   |  399.90 |  3500 |       59.90 |
| 12 | 户外运动      | 滑板       |  499.90 |  1200 |       59.90 |
| 11 | 户外运动      | 运动外套   |  799.90 |   500 |       59.90 |
|  8 | 户外运动      | 山地自行车 | 1399.90 |  2500 |       59.90 |
+----+---------------+------------+---------+-------+-------------+
12 rows in set (0.00 sec)

1.6.2 LAST_VALUE(expr)函数

LAST_VALUE(expr)函数返回最后一个expr的值。
举例：按照价格排序，查询最后一个商品的价格信息

mysql> SELECT id, category, NAME, price, stock,LAST_VALUE(price) OVER w AS last_price
    -> FROM goods WINDOW w AS (PARTITION BY category_id ORDER BY price) ;
+----+---------------+------------+---------+-------+------------+
| id | category      | NAME       | price   | stock | last_price |
+----+---------------+------------+---------+-------+------------+
|  5 | 女装/女士精品 | 百褶裙     |   29.90 |   500 |      29.90 |
|  1 | 女装/女士精品 | T恤        |   39.90 |  1000 |      39.90 |
|  2 | 女装/女士精品 | 连衣裙     |   79.90 |  2500 |      79.90 |
|  3 | 女装/女士精品 | 卫衣       |   89.90 |  1500 |      89.90 |
|  4 | 女装/女士精品 | 牛仔裤     |   89.90 |  3500 |      89.90 |
|  6 | 女装/女士精品 | 呢绒外套   |  399.90 |  1200 |     399.90 |
|  9 | 户外运动      | 登山杖     |   59.90 |  1500 |      59.90 |
|  7 | 户外运动      | 自行车     |  399.90 |  1000 |     399.90 |
| 10 | 户外运动      | 骑行装备   |  399.90 |  3500 |     399.90 |
| 12 | 户外运动      | 滑板       |  499.90 |  1200 |     499.90 |
| 11 | 户外运动      | 运动外套   |  799.90 |   500 |     799.90 |
|  8 | 户外运动      | 山地自行车 | 1399.90 |  2500 |    1399.90 |
+----+---------------+------------+---------+-------+------------+
12 rows in set (0.00 sec)

1.6.3 返回第n个值nth_value()

mysql> SELECT id, category, NAME, price,NTH_VALUE(price,2) OVER w AS second_price,
    -> NTH_VALUE(price,3) OVER w AS third_price
    -> FROM goods WINDOW w AS (PARTITION BY category_id ORDER BY price);
+----+---------------+------------+---------+--------------+-------------+
| id | category      | NAME       | price   | second_price | third_price |
+----+---------------+------------+---------+--------------+-------------+
|  5 | 女装/女士精品 | 百褶裙     |   29.90 |         NULL |        NULL |
|  1 | 女装/女士精品 | T恤        |   39.90 |        39.90 |        NULL |
|  2 | 女装/女士精品 | 连衣裙     |   79.90 |        39.90 |       79.90 |
|  3 | 女装/女士精品 | 卫衣       |   89.90 |        39.90 |       79.90 |
|  4 | 女装/女士精品 | 牛仔裤     |   89.90 |        39.90 |       79.90 |
|  6 | 女装/女士精品 | 呢绒外套   |  399.90 |        39.90 |       79.90 |
|  9 | 户外运动      | 登山杖     |   59.90 |         NULL |        NULL |
|  7 | 户外运动      | 自行车     |  399.90 |       399.90 |      399.90 |
| 10 | 户外运动      | 骑行装备   |  399.90 |       399.90 |      399.90 |
| 12 | 户外运动      | 滑板       |  499.90 |       399.90 |      399.90 |
| 11 | 户外运动      | 运动外套   |  799.90 |       399.90 |      399.90 |
|  8 | 户外运动      | 山地自行车 | 1399.90 |       399.90 |      399.90 |
+----+---------------+------------+---------+--------------+-------------+
12 rows in set (0.00 sec)

1.6.4 分桶函数

NTILE(n)函数将分区中的有序数据分为n个桶，记录桶编号。
举例：将goods表中的商品按照价格分为3组.

mysql> SELECT ntile(3) over w nt,id,category,NAME,price
    -> FROM goods window w AS (PARTITION BY category ORDER BY price);
+----+----+---------------+------------+---------+
| nt | id | category      | NAME       | price   |
+----+----+---------------+------------+---------+
|  1 |  5 | 女装/女士精品 | 百褶裙     |   29.90 |
|  1 |  1 | 女装/女士精品 | T恤        |   39.90 |
|  2 |  2 | 女装/女士精品 | 连衣裙     |   79.90 |
|  2 |  3 | 女装/女士精品 | 卫衣       |   89.90 |
|  3 |  4 | 女装/女士精品 | 牛仔裤     |   89.90 |
|  3 |  6 | 女装/女士精品 | 呢绒外套   |  399.90 |
|  1 |  9 | 户外运动      | 登山杖     |   59.90 |
|  1 |  7 | 户外运动      | 自行车     |  399.90 |
|  2 | 10 | 户外运动      | 骑行装备   |  399.90 |
|  2 | 12 | 户外运动      | 滑板       |  499.90 |
|  3 | 11 | 户外运动      | 运动外套   |  799.90 |
|  3 |  8 | 户外运动      | 山地自行车 | 1399.90 |
+----+----+---------------+------------+---------+
12 rows in set (0.00 sec)

1.7 总结

窗口函数的特点是可以分组，而且可以在分组内排序。另外，窗口函数不会因为分组而减少原表中的行数，这对我们在原表数据的基础上进行统计和排序非常有用。
与聚合函数的区别主要如下：

            实现方式                    返回结果不同                     分组方式
聚合函数    通过分组查询进行             将多条记录聚合返回成一条或几条    group by
窗口函数     通过over子句定义的窗口进行    有多少条数据还是返回多少条数据    partition by

2.公用表达式（with as）

公用表表达式（或通用表表达式）简称为CTE（Common Table Expressions）。CTE是一个命名的临时结果集，作用范围是当前语句。CTE可以理解成一个可以复用的子查询，当然跟子查询还是有点区别的，CTE可以引用其他CTE，但子查询不能引用其他子查询。所以，可以考虑代替子查询。依据语法结构和执行方式的不同，公用表表达式分为 普通公用表表达式 和 递归公用表表达式 2 种。

2.1 普通公用表表达式

基本语法结构：

with cte 名称
as (子查询)
select|delete|update语句;

案例：查询员工所在的部门的详细信息。
使用子查询方式如下：

mysql> SELECT * FROM departments
    -> WHERE department_id IN (
    -> SELECT DISTINCT department_id FROM employees
    -> );
+---------------+------------------+------------+-------------+
| department_id | department_name  | manager_id | location_id |
+---------------+------------------+------------+-------------+
|            10 | Administration   |        200 |        1700 |
|            20 | Marketing        |        201 |        1800 |
|            30 | Purchasing       |        114 |        1700 |
|            40 | Human Resources  |        203 |        2400 |
|            50 | Shipping         |        121 |        1500 |
|            60 | IT               |        103 |        1400 |
|            70 | Public Relations |        204 |        2700 |
|            80 | Sales            |        145 |        2500 |
|            90 | Executive        |        100 |        1700 |
|           100 | Finance          |        108 |        1700 |
|           110 | Accounting       |        205 |        1700 |
+---------------+------------------+------------+-------------+
11 rows in set (0.02 sec)

使用CTE如下：

mysql> WITH cte_emp
    -> AS (SELECT DISTINCT department_id
    -> FROM employees
    -> )
    -> SELECT * FROM departments
    -> JOIN cte_emp
    -> ON departments.`department_id` = cte_emp.department_id;
+---------------+------------------+------------+-------------+---------------+
| department_id | department_name  | manager_id | location_id | department_id |
+---------------+------------------+------------+-------------+---------------+
|            10 | Administration   |        200 |        1700 |            10 |
|            20 | Marketing        |        201 |        1800 |            20 |
|            30 | Purchasing       |        114 |        1700 |            30 |
|            40 | Human Resources  |        203 |        2400 |            40 |
|            50 | Shipping         |        121 |        1500 |            50 |
|            60 | IT               |        103 |        1400 |            60 |
|            70 | Public Relations |        204 |        2700 |            70 |
|            80 | Sales            |        145 |        2500 |            80 |
|            90 | Executive        |        100 |        1700 |            90 |
|           100 | Finance          |        108 |        1700 |           100 |
|           110 | Accounting       |        205 |        1700 |           110 |
+---------------+------------------+------------+-------------+---------------+
11 rows in set (0.00 sec)

可以看出cte相当于是生成了一个临时表。跟子查询相比，公用表表达式有一个优点，就是定义过公用表表达式之后的查询，可以像一个表一样多次引用公用表表达式，而子查询
则不能。

2.2 递归公用表表达式

递归公用表表达式也是一种公用表表达式，只不过，除了普通公用表表达式的特点以外，它还有自己的特点，就是可以调用自己。它的语法结构是

WITH RECURSIVE
CTE名称 AS （子查询）
SELECT|DELETE|UPDATE 语句;

递归公用表表达式由 2 部分组成，分别是种子查询和递归查询，中间通过关键字 UNION [ALL]进行连接。这里的种子查询，意思就是获得递归的初始值。这个查询只会运行一次，以创建初始数据集，之后递归查询会一直执行，直到没有任何新的查询数据产生，递归返回。

针对于我们常用的employees表，包含employee_id,last_name和manager_id三个字段。如果a是b
的管理者，那么，我们可以把b叫做a的下属，如果同时b又是c的管理者，那么c就是b的下属，是a的下下属。我们要得到所有下下属的人员信息

用递归公用表表达式中的种子查询，找出初代管理者。字段 n 表示代次，初始值为 1，表示是第一代管理者。
用递归公用表表达式中的递归查询，查出以这个递归公用表表达式中的人为管理者的人，并且代次的值加 1。直到没有人以这个递归公用表表达式中的人为管理者了，递归返回。
在最后的查询中，选出所有代次大于等于 3 的人，他们肯定是第三代及以上代次的下属了，也就是下下属了。这样就得到了我们需要的结果集。

WITH RECURSIVE cte
AS
( SELECT employee_id,last_name,manager_id,1 AS n FROM employees WHERE employee_id = 100
#种子查询，找到第一代领导
UNION ALL
SELECT a.employee_id,a.last_name,a.manager_id,n+1 FROM employees AS a JOIN cte
ON (a.manager_id = cte.employee_id) #递归查询，找出以递归公用表表达式的人为领导的人
) 
SELECT employee_id,last_name FROM cte WHERE n >= 3;

Mysql数据库基础第八章：窗口函数和公用表表达式（CTE）

Mysql数据库基础系列

1.窗口函数

1.1窗口函数分类

1.2 窗口函数的语法结构

1.3 序号函数

1.3.1 row_number()函数

1.3.2 rank()函数

1.3.3 dense_rank()函数

1.4 分布函数

1.4.1.percent_rank()函数

1.4.2.cume_dist()函数

1.5前后函数

1.5.1 lag(expr,n)函数

LAG(expr,n)函数返回当前行的前n行的expr的值。

举例：查询goods数据表中前一个商品价格与当前商品价格的差值

1.5.2．LEAD(expr,n)函数

1.6 其他函数

1.6.1 FIRST_VALUE(expr)函数

1.6.2 LAST_VALUE(expr)函数

1.6.3 返回第n个值nth_value()

1.6.4 分桶函数

1.7 总结

2.公用表达式（with as）

2.1 普通公用表表达式

2.2 递归公用表表达式

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Mysql数据库基础第八章：窗口函数和公用表表达式（CTE）

Mysql数据库基础系列

1.窗口函数

1.1窗口函数分类

1.2 窗口函数的语法结构

1.3 序号函数

1.3.1 row_number()函数

1.3.2 rank()函数

1.3.3 dense_rank()函数

1.4 分布函数

1.4.1.percent_rank()函数

1.4.2.cume_dist()函数

1.5前后函数

1.5.1 lag(expr,n)函数

LAG(expr,n)函数返回当前行的前n行的expr的值。

举例：查询goods数据表中前一个商品价格与当前商品价格的差值

1.5.2．LEAD(expr,n)函数

1.6 其他函数

1.6.1 FIRST_VALUE(expr)函数

1.6.2 LAST_VALUE(expr)函数

1.6.3 返回第n个值nth_value()

1.6.4 分桶函数

1.7 总结

2.公用表达式（with as）

2.1 普通公用表表达式

2.2 递归公用表表达式

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像