开发者学堂课程【深入理解数据分析:推论性统计分析】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/561/detail/7685
推论性统计分析
一、数理统计的基本概念与抽样分布
二、数理统计的几个基本概念
三、常用统计分布分析
四、抽样分布之正态总体的样本均值与方差的分布
五、参数评估
六、区间估计之正态总体均值的区间估计
七、假设检验的基本原理
八、两类错误
九、假设检验的一般步骤
一、数理统计的基本概念与抽样分布
数理统计是研究大量随机现象的统计规律性的一门数学科学,它以概率论为基础研究如何用有效的方式收集、整理和分析受到随机性影响的数据,从而为随机现象选择和检验数学模型,并且在此基础上对随机现象的性质、特点和统计规律作出推断和预测,直至为决策和行动提供依据和建议。
二、数理统计的几个基本概念
1.总体
数理统计研究某个问题时,把被研究对象的全体称为总体(或母体),而把组成总体的每一个单元(或元素)称为个体。
2.样本
为了研究总体的情况,一般只能在这个总体中抽取出一定数量的个体进行观测此过程称为抽样(也称取样、采样)。
3.统计量
样本是对总体进行统计分析和推断的依据,但在处理具体的理论和应用问题时,却很少直接利用样本所提供的原始数据,而是要对这些数据进行加工、提炼,把样本中所包含的有关信息集中起来。这便是针对不同问题构造样本的某种函数。样本的函数常称为统计量。
三、常用统计分布分析
常用统计分布之 X2分布
定义1设随机变量1,范2,…n 独立、同分布,且;~N(O,1)(i =1 ,2 ,...,n)
则随机变量
所服从的分布称为自由度是n的x2分布,而且这个随机变量称为x2变量,简记为 x2~x 2(n)。
定义2设,n 独立,且~N(O,1),n~X 2(n),则随机变量
T=
称为自由度为 n 的 t 变量,它所服从的分布称为 t 分布,通常记为 t~t( n)。
常用统计分布之F分布
定义3 设,n 独立,且~x 2(m),n~x 2(n),则随机变量
称为自由度为(m, n)的 F 变量,它所服从的分布称为F分布,通常记作 F~ F(m, n),其中 m 称为第一自由度, n 称为第二自由度。
四、抽样分布之正态总体的样本均值与方差的分布
本段就总体服从正态分布的情形进行讨论
定理1设随机变量1,t2,".n 相互独立,且
则它们的任一确定的线性函数
其中常数 k,, k2,",kn 不全为零。
五、参数评估
根据样本推断总体的分布或分布的数字特征称为统计推断。它是数理统计学的核心。有一类统计推断问题是总体的分布函数或概率函数的数学表达式为已知,但它的某些参数(总体的数字特征也作为参数)却未知,我们要求对未知参数或未知参数的函数进行估计,这类问题称为参数估计问题。
参数估计分为点估计与区间估计两种。本章主要介绍求估计量的方法、估计量优劣的评判标准和总体均值与方差的区间估计。
六、区间估计之正态总体均值的区间估计
本段总是假定总体~N(u ,2) ,u为未知数,而(1 ,2 ,... ,n)为的一个样本。
(1). 2已知,求u的置信区间
(2). 2未知,求u的置信区间
设总体为的容量为n1的样
本;又设另一个总体为的容量为的样本。且设这两个样本独立。
设总体为的容量为n1的样本;又设另一总体为n的容量为n2的样本;且设这两个样本相互独立,分别为这两个样本的修正样本方差﹒在参数都为未知时,我们来求方差比的1 - α置信区间。
七、假设检验的基本原理
不论假设是怎么样的,进行检验的基本思想却是一个,就是所谓概率性质的反证法:
为了检验原假设 H0是香正确,我们先假定这个假设 H0为正确,看由此能推出什么结果,如果导致一个不合理现象的出现,则表明“假设 H0。
为正确”是错误的,即原假设 H0不正确,因此我们拒绝原假设 H0。如果没有导致不合理现象出现,则不能认为原假设 H0不正确,因为我们不拒绝 H0,此时根据问题的需要或作进一步的试验考察或接受 H0。
八、两类错误
(1)原 H0。本来是正确的,但我们却拒绝了 H0,这就犯了错误。这类错误称为拒真(弃真)错误,也称为第一类错误。
其发生概率称为拒真概率或犯第一类错误的概率,通常记为α,即 P{拒绝 H0│H0为真}=α
(2)原假设 H0本来不正确,但我们却接受了 H0,这类错误称为纳伪错误,也称为第二类错误﹒其发生的概率称纳伪概率或犯第二类错误的概率,通常记为β,即 Р{接受 H0|H0不真}=β
九、假设检验的一般步骤
1.根据问题的要求提出原假设 H0与备择假设 H1
2.构造检验统计量与确定拒绝域的形式
3.选定适当的显著性水平 α,并求出临界值
4.根据样本观测值确定是否拒绝 H0方差2为已知时均值μ的假设检验当2为已知时,
在给定显著性水平 α 下,关于正态总体均值的常见的假设检验问题有三类:
(1)双侧检验
(2)右侧检验
(3)左侧检验