开发者学堂课程【人工智能必备基础:概率论与数理统计:卡方分布】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/545/detail/7426
卡方分布
内容介绍
一、定义
二、公式
一、定义
通俗的说就是通过小数量的样本容量去预估总体容量的分布情况
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度
若 n 个相互独立的随机变量 ξ1,ξ2,.....ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这 n 个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布( chi-square distribution )
自由度:假设你现在手头有 3 个样本,因为样本具有随机性,所以它们取值不定。但是假设出于某种原因,我们需要让样本均值固定。比如说为 0,那么这时真正取值自由。“有随机性”的样本只有 2 个。试想,如果,那么每选取一组的取值,将不得不等于对于第三个样本来说,这种"不得不”就可以理解为被剥夺了一个自由度。所以就这个例子而言,3 个样本最终"自由”的只有其中的 2 个。不失一般性,个样本,留出一个自由度给固定的均值,剩下的自由度即为。
卡方检验的基本思想是根据样本数据推断总体的频次与期望频次是否有普遍性差异
二、公式
卡方分布 -chi2
自由度为 4 的图像
自由度大小对结果的影响
当 k 越大越接近于标准正态分布