文档备案控制台

开发者社区云计算文章正文

数据的偏度和峰度——df.skew()、df.kurt()

2022-11-16 1170

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据的偏度和峰度——df.skew()、df.kurt()

数据的偏度和峰度——df.skew()、df.kurt()

我们一般会拿偏度和峰度来看数据的分布形态，而且一般会跟正态分布做比较，我们把正态分布的偏度和峰度都看做零。如果我们在实操中，算到偏度峰度不为0，即表明变量存在左偏右偏，或者是高顶平顶这么一说。

一.偏度（Skewness）

Definition:是描述数据分布形态的统计量，其描述的是某总体取值分布的对称性，简单来说就是数据的不对称程度。。

偏度是三阶中心距计算出来的。

（1）Skewness = 0 ，分布形态与正态分布偏度相同。

（2）Skewness > 0 ，正偏差数值较大，为正偏或右偏。长尾巴拖在右边，数据右端有较多的极端值。

（3）Skewness < 0 ，负偏差数值较大，为负偏或左偏。长尾巴拖在左边，数据左端有较多的极端值。

（4）数值的绝对值越大，表明数据分布越不对称，偏斜程度大。

计算公式：

∣Skewness∣ 越大，分布形态偏移程度越大。

二.峰度（Kurtosis）

Definition:偏度是描述某变量所有取值分布形态陡缓程度的统计量，简单来说就是数据分布顶的尖锐程度。

峰度是四阶标准矩计算出来的。

（1）Kurtosis=0 与正态分布的陡缓程度相同。

（2）Kurtosis>0 比正态分布的高峰更加陡峭——尖顶峰

（3）Kurtosis<0 比正态分布的高峰来得平台——平顶峰

计算公式：

皮卡丘敲爱Kedreamix

目录

相关文章

楠竹11

|

机器学习/深度学习计算机视觉

AIGC核心技术——计算机视觉（CV）预训练大模型

【1月更文挑战第13天】AIGC核心技术——计算机视觉（CV）预训练大模型

楠竹11

1356 3 3

AIGC核心技术——计算机视觉（CV）预训练大模型

灵杰开发者

|

存储分布式计算 Apache

构建 Streaming Lakehouse：使用 Paimon 和 Hudi 的性能对比

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文将在阿里云EMR 上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，然后分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

灵杰开发者

61026 9 10

构建 Streaming Lakehouse：使用 Paimon 和 Hudi 的性能对比

云栖号资讯小哥

|

机器学习/深度学习人工智能算法

黑盒模型事后归因解析：SHAP 方法

近年来人工智能的浪潮越来越汹涌，以神经网络、集成模型为代表的机器学习模型在数据挖掘领域中发挥着不可替代的作用。在追求模型高精度的道路上，工业界和学术界也十分关注模型的可解释性，期待从复杂模型中得到更直观的理解。

云栖号资讯小哥

5660 0 0

183王德发

Vision Transformer 图像分类识别基于 ViT（Vision Transformer）的图像十分类实战完整代码毕业设计

Vision Transformer 图像分类识别基于 ViT（Vision Transformer）的图像十分类实战完整代码毕业设计

183王德发

592 0 0

Vision Transformer 图像分类识别基于 ViT（Vision Transformer）的图像十分类实战完整代码毕业设计

小Lee

|

运维 Kubernetes 关系型数据库

云计算运维工程师面试技巧

【8月更文挑战第6天】

小Lee

1598 1 3

jianz123

|

Android开发开发者

安卓投屏神器 Scrcpy安报错ERROR: Could not find any ADB device

使用Scrcpy安卓投屏工具时遇到报错，问题根源是未开启开发者模式。解决步骤：进入设置，点击【关于手机】→连续点击版本号激活开发者模式，然后在【系统设置】→【开发者选项】中开启USB调试。参照此方法后可正常执行。Scrcpy软件下载链接和GitHub页面也已提供。

jianz123

3147 1 1

土木林森

|

Python

在Python中，如何指定文件的读取和写入模式？

【2月更文挑战第10天】【2月更文挑战第27篇】在Python中，如何指定文件的读取和写入模式？

土木林森

598 3 3

小羊失眠啦.

|

缓存网络协议数据可视化

可视化文件编辑与SSH传输神器WinSCP如何公网远程访问本地服务器

可视化文件编辑与SSH传输神器WinSCP如何公网远程访问本地服务器

小羊失眠啦.

919 0 0

布客飞龙

|

存储 C++ 索引

BackTrader 中文文档（二）(1)

BackTrader 中文文档（二）

布客飞龙

462 0 0

布客飞龙

|

测试技术索引 Python

BackTrader 中文文档（二）(2)

BackTrader 中文文档（二）

布客飞龙

412 0 0

热门文章

最新文章

【已解决】SpringBoot 启动报错：Failed to configure a DataSource: ‘url‘ attribute is not specified and no emb

企业数据创新之旅——高性能NAS助力业务上云

Java注释规范整理

uniapp App端解决input@input事件动态修改值不生效的问题

Android手机教你如何找到USB调试

Flow云服务改善城市生活的基础是控制城市，你敢用吗？

glyphicons-halflings-regular.woff 404

蓝牙耳机连接笔记本电脑Think E430C

2013-7-15学习一些修饰词的比较

【AgentScope Java新手村系列】（8）多Agent协作

阿里云服务器镜像解析：公共、自定义、共享、社区镜像等区别与选择参考

用于实验室智能识别的目标检测数据集分享（适用于YOLO系列深度学习分类检测任务）

通過OPTIONS交換schema

【Azure AI Search】Index的字段使用默认Analyzer(standard.lucene) 和 en.microsoft 有什么不同？

Flash-KMeans：快速且内存高效的精确 K-Means，可在单张 GPU 进行亿级数据的聚类

阿里云VPC专有网络架构规划完全指南：从零构建企业级网站服务器网络

意图共鸣科技《历史的韵脚》：云时代后的第三次下放浪潮——当认知与决策能力走向每个普通人

日常巡检 Oracle 时，ChatDBA 怎么把会话、SQL 和等待事件一起看

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

利用阿里云OSS（对象存储服务）快速搭建私人网盘