文档备案控制台

开发者社区问答正文

最佳实践 -SQL Server -解析SQL Server 2012常用的分析函数

分析函数CUME_DIST

微软的定义：
计算某个值在SQL Server 2012中的一组值内的累积分布。CUME_DIST计算某指定值在一组值中的相对位置。对于行r，假定采用升序，r的CUME_DIST是值低于或等于r的值的行数除以在分区或查询结果集中求出的行数。
函数解析：
执行如下代码，构造一组数据。

DECLARE
@analytic TABLE(
name varchar(35) ,
dept varchar(35),
salary money
)
INSERT INTO @analytic
VALUES
--bd
('andy01','bd',15000),
('andy02','bd',12000),
('andy03','bd',12000),
('andy04','bd',10000),
('andy05','bd',8000),
--ca
('andy06','ca',20000),
('andy07','ca',18000),
('andy08','ca',18000),
('andy09','ca',15000),
('andy10','ca',12000),
('andy11','ca',12000),
('andy12','ca',10000),
('andy13','ca',8000),
('andy14','ca',8000),
('andy15','ca',8000)
SELECT
dept,name ,salary,
CUME_DIST() OVER(PARTITION BY dept ORDER BY salary) AS cume_dist_
FROM @analytic
ORDER BY dept,salary DESC

返回结果如下：
[url=http://docs-aliyun.cn-hangzhou.oss.aliyun-inc.com/assets/pic/67532/cn_zh/1519810205856/CUME_DIST%E8%BF%94%E5%9B%9E%E7%BB%93%E6%9E%9C.png][/url]
示例分析：
按照dept分区，根据salary排序，比较当前记录和后一条记录（偏移量为1）的salary值的差值，这个非常实用。

展开

收起

梨好橙 2018-09-09 23:12:27 1554 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

分析函数CUME_DIST在数据库查询中扮演着重要的角色，它用于计算一组值内某个特定值的累积分布。具体来说，CUME_DIST函数能够帮助我们了解某个值在排序列表中的相对位置，通过计算小于等于（升序排列）或大于等于（降序排列）当前值的行数与总行数的比例来实现这一功能。

CUME_DIST函数解析

定义：在SQL Server 2012及其它支持此函数的数据库系统中，CUME_DIST函数根据指定的排序标准（通常是ORDER BY子句），为每一行返回一个累积分布值。这个值表示的是，在当前行之前（包括当前行），具有相同或更低（升序）/更高（降序）排序值的行数占分区总行数的比例。
使用场景：该函数常用于数据分析，比如评估员工薪资水平在部门内的分布情况、统计成绩排名的百分位等场景。

示例代码：

DECLARE @analytic TABLE(
name VARCHAR(35), 
dept VARCHAR(35), 
salary MONEY
);

INSERT INTO @analytic 
VALUES
('andy01','bd',15000),
('andy02','bd',12000),
-- 省略中间插入语句以保持简洁
('andy15','ca',8000);

SELECT 
dept, 
name, 
salary,
CUME_DIST() OVER(PARTITION BY dept ORDER BY salary) AS cume_dist_
FROM @analytic
ORDER BY dept, salary DESC;

结果解释：执行上述代码后，每一条记录将附加一列cume_dist_，显示该员工的薪水在其所在部门的累积分布比例。例如，如果某员工的累积分布值为66.67%，这意味着在该部门中，有66.67%的员工薪水低于或等于该员工。

注意事项

分区与排序：正确使用PARTITION BY和ORDER BY子句是关键。PARTITION BY用来定义数据的分组依据，而ORDER BY则决定了累积分布的计算顺序。
升降序影响：根据排序方式的不同，CUME_DIST计算逻辑会有所变化，确保按照实际需求选择正确的排序方向。

应用价值

CUME_DIST不仅能够提供数据集内部的相对位置信息，还能辅助进行更深层次的数据分析，如市场细分、绩效评估、风险分析等领域，是数据科学家和分析师不可或缺的工具之一。

通过上述说明和示例，您应该对CUME_DIST函数有了较为全面的理解，并能将其应用于具体的数据处理任务中。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

SQL 云数据库 RDS SQL Server 版对象存储云解析DNS

问答标签：

SQL解析 SQL SQLServer sql云数据库RDS SQLServer版云数据库RDS SQLServer版sql SQL分析

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Mysql的Binlog日志本地解析后，Sql内容中的中文乱码，如何解决

1414

4

0

使用 surftrace 追踪函数时，如何解析每个 skb 对应报文的三层协议（IP层）的成员？

209

1

0

holo中用函数解析报错时什么原因？

239

1

0

ack的dns最佳实践是什么？

232

1

0

为什么说对于“解析出SQL中所有的函数”的需求，观察者模式可能更加合适？

188

1

0

使用`regexp_extract_all`函数解析字符串需要怎么做？

505

1

0

sls解析json的函数是什么以及用途？

232

0

0

大数据计算MaxCompute有解析ua的函数吗？

220

1

0

大数据计算MaxCompute有ip解析函数吗？

310

1

0

DataWorks这个输出参数是不支持函数解析的对吗我需要怎么传参呢？

218

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

【Qoder CN】模型提供商：支持自定义第三方的URL

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

Qoder Work是个好家伙，但是什么时候能支持自定义模型API？

相关文章

阿里云RDS数据迁移完全实战手册：从本地数据库到云端平滑上云

阿里云国际站安全中心：日志检索攻击溯源实战

哔哩哔哩基于阿里云PolarDB与通义千问构建全域内容洞察新框架

通用Agent技能：5个开箱即用的业务自动化Skill

一个文件夹 + 一个Markdown文件 = 你的第一个Skill

相关解决方案

更多

SelectDB实现日志高效存储与实时分析

精准分析检索，打造商品推荐体验

分析 Agent 实现一键 AI 数据洞察

实现 MySQL 到 ADB 秒级分析性能

泛时序数据一站式分析与洞察

还有其他疑问?