窗口函数(sample database classicmodels _No.8 )
准备工作,可以去下载 classicmodels 数据库具体如下
点击:classicmodels
什么是窗口函数?
开窗函数(Window Function)是一种在关系型数据库中执行计算的功能,它能够在查询结果集的子集(窗口)上执行聚合、排序和分析操作,而不会改变原始查询结果的行数。开窗函数通常与聚合函数(如SUM、AVG、COUNT等)结合使用,以便在给定的窗口中对数据进行分析。
开窗函数在SQL标准中得到广泛支持,并且在许多主流的关系型数据库管理系统(如PostgreSQL、MySQL、Oracle、SQL Server等)中都有实现。开窗函数的语法通常如下:
<窗口函数>(<表达式>) OVER (PARTITION BY <分区键> ORDER BY <排序键> [窗口定义])
其中:
<窗口函数>:要执行的聚合或分析函数,例如SUM、AVG、ROW_NUMBER等。
<表达式>:要对其执行窗口函数的列或表达式。
PARTITION BY:用于将结果集分区的列或表达式。它将数据分成不同的组,在每个组内执行窗口函数。
ORDER BY:对分区中的行进行排序的列或表达式。
[窗口定义]:可选部分,用于定义窗口的边界。包括ROWS、RANGE等窗口类型。
通过使用开窗函数,可以执行一系列分析操作,如计算累积总和、计算移动平均值、计算排名等。这使得在查询结果中执行复杂的分析变得更加简单和高效。
二、实例1
select orderNumber , orderLineNumber , productCode , quantityOrdered*priceEach as sumcost, sum(quantityOrdered*priceEach) over (PARTITION BY orderNumber) as totalcost, row_number() over (PARTITION BY orderNumber order by quantityOrdered*priceEach desc) as cost_order ,concat( round(quantityOrdered*priceEach/sum(quantityOrdered*priceEach) over (PARTITION BY orderNumber) * 100.00,2.0) ,'%') as 'rate%' FROM orderdetails join orders USING (orderNumber) where year(orderDate) in ('2004') and status='Shipped'
知识点:
quantityOrdered*priceEach as sumcost sum(quantityOrdered*priceEach) over (PARTITION BY orderNumber) as totalcost
quantityOrdered-订单数量
priceEach-订单单价
sumcost就是总价
sum(quantityOrderedpriceEach)就是 单价和数量汇总
PARTITION BY orderNumber 意思是根据 orderNumber 分组
sum(quantityOrderedpriceEach) over (PARTITION BY orderNumber) 这个意思就是根据 orderNumber 分组后汇总订单金额row_number() 函数 是 其分区内的当前行数
二、实例2
select orderNumber ,quantityOrdered*priceEach as sumcost, PERCENT_RANK() over (PARTITION BY orderNumber order by quantityOrdered*priceEach desc), CUME_DIST() over (PARTITION BY orderNumber order by quantityOrdered*priceEach desc) FROM orderdetails join orders USING (orderNumber) where year(orderDate) in ('2004') and status='Shipped'
PERCENT_RANK() over (PARTITION BY orderNumber order by quantityOrdered*priceEach desc)
这个数根据百分比算 出,百分比排名值,并且可以看到第一行永远是 0,表中orderbumber =10217 有 7个子订单,
就是1/(7-1)=0.16666 平分6份,每一份是 0.16666
CUME_DIST() over (PARTITION BY orderNumber order by quantityOrdered*priceEach desc)
这个数根据累计分组后的累计值 ,并不是平分值,1/7=0.1428 然后在累计
总结
窗口函数(Window Function)是一种在SQL中执行计算的特殊函数,它能够在查询结果的子集(窗口)上进行聚合、排序和分析操作,而不改变原始查询结果的行数。窗口函数通常与OVER子句一起使用,以定义要应用窗口函数的数据子集。
窗口函数提供了一种在结果集内执行各种聚合和分析操作的强大机制,而无需对查询进行分组。这意味着您可以在结果集中执行各种计算而无需对整个结果集进行聚合。
窗口函数通常用于以下场景之一:
对分组数据执行聚合操作:与GROUP
BY子句不同,窗口函数可以对整个结果集进行聚合,而不会减少结果行数。例如,您可以计算每个行的累积总和或平均值。
执行排名和排序操作:您可以使用窗口函数对结果集中的行进行排序,并为每行分配排名或行号。这使得可以轻松地确定数据的顺序和排名。
执行移动平均和累积计算:窗口函数允许您在结果集内执行移动平均、累积和其他类似的计算。这对于趋势分析和预测非常有用。
执行分析函数:您可以使用窗口函数执行各种分析操作,如计算行与前一行之间的差异或百分比变化等。
SQL标准中定义了一系列窗口函数,常见的包括SUM、AVG、COUNT、ROW_NUMBER、RANK、DENSE_RANK等。这些函数可以与OVER子句一起使用,以指定窗口的范围和排序方式。
但用的最频繁的一般这4个
函数DENSE_RANK() ,RANK(),ROW_NUMBER(),LAG()