单因子探索分析

简介: 单因子分析单因素分析(monofactor analysis)是指在一个时间点上对某一变量的分析。目的在于描述事实。例如:师生年龄构成、性别构成,学生社会出身分布,学业成绩分布等。

单因子分析


单因素分析(monofactor analysis)是指在一个时间点上对某一变量的分析。目的在于描述事实。例如:师生年龄构成、性别构成,学生社会出身分布,学业成绩分布等。


集中趋势和离中趋势

  • 集中趋势(数据聚拢位置的衡量)
    • 均值
    • 中位数
    • 众数
    • 分位数 (注意计算方式)
  • 离中趋势(数据离散程度的衡量)
    • 标准差
    • 方差

偏态与峰度

偏态系数
img_02138ee41d156f8846e059b3c59ffff1.png

偏态系数形容数据的偏向,偏态系数为正的数据即正偏,即均值偏大

峰态系数
img_fa9af5a61e8b9069c912987caf744f64.png

值越小越平缓,一般正态分布的峰态系数为3.。如果一个分布的峰度小于1或大于5,则可以断定该分布不是正态分布


三大分布和正态分布

img_4d2293baf11e069921a181862dd4f27c.png
卡方分布、t分布、F分布

抽样理论

img_675d1c7d88e7fbd82f824d17ea394c11.png

数据分类

img_349a024b988ee1a7490d411e9d074aad.png




单属性分析

img_251842131101fe89561fbcf9c11d567d.png
异常值分析
img_71df8f701e92552957361bb538ef3fc9.png

对比分析
img_c824d702b253cc987fb716f8c105bd6a.png

结构分析
img_5eadbb4e10e8539b04167c2e3af87234.png
目录
相关文章
|
6月前
|
机器学习/深度学习 算法 测试技术
处理不平衡数据的过采样技术对比总结
在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类,忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。
269 0
|
6月前
|
算法
7-6 连续因子
7-6 连续因子
49 0
|
3月前
|
机器学习/深度学习 PyTorch 算法框架/工具
数据平衡与采样:使用 DataLoader 解决类别不平衡问题
【8月更文第29天】在机器学习项目中,类别不平衡问题非常常见,特别是在二分类或多分类任务中。当数据集中某个类别的样本远少于其他类别时,模型可能会偏向于预测样本数较多的类别,导致少数类别的预测性能较差。为了解决这个问题,可以采用不同的策略来平衡数据集,包括过采样(oversampling)、欠采样(undersampling)以及合成样本生成等方法。本文将介绍如何利用 PyTorch 的 `DataLoader` 来处理类别不平衡问题,并给出具体的代码示例。
729 2
|
5月前
技术心得记录:可决系数R^2和方差膨胀因子VIF
技术心得记录:可决系数R^2和方差膨胀因子VIF
67 0
|
6月前
|
算法 BI 测试技术
【唯一分解定理 数学】1808好因子的最大数目
【唯一分解定理 数学】1808好因子的最大数目
【唯一分解定理 数学】1808好因子的最大数目
致命因子:达克效应
其实,往往有的时候,“思维方式”比提升技术更为重要,在个人职业发展生涯中,因此,今天,我们扯一下:做人。
117 0
|
测试技术 Python
为什么以及如何在多重假设检验中调整 P 值
为什么以及如何在多重假设检验中调整 P 值
317 0
|
算法 数据挖掘 Python
使用Imblearn对不平衡数据进行随机重采样
使用Imblearn对不平衡数据进行随机重采样
352 0
使用Imblearn对不平衡数据进行随机重采样
|
机器学习/深度学习 算法 数据挖掘
通过随机采样和数据增强来解决数据不平衡的问题
通过随机采样和数据增强来解决数据不平衡的问题
332 0
通过随机采样和数据增强来解决数据不平衡的问题
|
机器学习/深度学习
使用遗传交叉算子进行过采样处理数据不平衡(三)
使用遗传交叉算子进行过采样处理数据不平衡
142 0
使用遗传交叉算子进行过采样处理数据不平衡(三)