卡方分布 | 学习笔记

简介: 快速学习卡方分布

开发者学堂课程【人工智能必备基础:概率论与数理统计:卡方分布】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7426


卡方分布

内容介绍

一、定义

二、公式

 

一、定义

通俗的说就是通过小数量的样本容量去预估总体容量的分布情况

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度

若 n 个相互独立的随机变量 ξ1,ξ2,.....ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这 n 个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布( chi-square distribution )

自由度:假设你现在手头有 3 个样本,因为样本具有随机性,所以它们取值不定。但是假设出于某种原因,我们需要让样本均值固定。比如说为 0,那么这时真正取值自由。“有随机性”的样本只有 2 个。试想,如果,那么每选取一组的取值,将不得不等于对于第三个样本来说,这种"不得不”就可以理解为被剥夺了一个自由度。所以就这个例子而言,3 个样本最终"自由”的只有其中的 2 个。不失一般性,个样本,留出一个自由度给固定的均值,剩下的自由度即为。

卡方检验的基本思想是根据样本数据推断总体的频次与期望频次是否有普遍性差异

 

二、公式

image.png

卡方分布 -chi2

自由度为 4 的图像

image.png

自由度大小对结果的影响

image.png

当 k 越大越接近于标准正态分布

相关文章
|
7月前
|
机器学习/深度学习 监控 数据挖掘
数据并非都是正态分布:三种常见的统计分布及其应用
这篇文章除了介绍线性模型在减肥app预测中的不切实际性,还探讨了不同统计分布在体重管理和数据分析中的应用。文章提到了正态分布和泊松分布,前者常用于描述围绕平均值对称分布的连续数据,如体重;后者适合计数数据,如体重变化次数。正态分布以其钟形曲线闻名,泊松分布则描述独立事件的数量。文章还简要介绍了卡方分布在检验分类变量关系时的作用。最后,文章指出了在线性回归中假设数据正态分布的原因,包括便于统计推断和最小化估计误差。
615 5
三大抽样分布——卡方分布、t分布、F分布
三大抽样分布——卡方分布、t分布、F分布
|
数据可视化 Python
概率学中的随机变量与分布
概率学中的随机变量与分布
概率学中的随机变量与分布
|
机器学习/深度学习 数据挖掘
06 随机变量及其分布
06 随机变量及其分布
98 0
(一)探索随机变量及其分布:概率世界的魔法
(一)探索随机变量及其分布:概率世界的魔法
|
机器学习/深度学习
先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计
先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计
228 0
先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计
|
数据处理
集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关
集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关
546 0
集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关
L3-连续变量分布:均匀分布、指数分布、正态分布
L3-连续变量分布:均匀分布、指数分布、正态分布
L3-连续变量分布:均匀分布、指数分布、正态分布
|
机器学习/深度学习 人工智能 开发者
二项式分布 | 学习笔记
快速学习二项式分布
二项式分布 | 学习笔记

热门文章

最新文章

下一篇
开通oss服务