推论性统计分析 | 学习笔记

简介: 快速学习 推论性统计分析

开发者学堂课程【深入理解数据分析推论性统计分析学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/561/detail/7685


推论性统计分析


一、数理统计的基本概念与抽样分布

二、数理统计的几个基本概念

三、常用统计分布分析

四、抽样分布之正态总体的样本均值与方差的分布

五、参数评估

六、区间估计之正态总体均值的区间估计

七、假设检验的基本原理

八、两类错误

九、假设检验的一般步骤


一、数理统计的基本概念与抽样分布

数理统计是研究大量随机现象的统计规律性的一门数学科学,它以概率论为基础研究如何用有效的方式收集、整理和分析受到随机性影响的数据,从而为随机现象选择和检验数学模型,并且在此基础上对随机现象的性质、特点和统计规律作出推断和预测,直至为决策和行动提供依据和建议。


二、数理统计的几个基本概念

1.总体

数理统计研究某个问题时,把被研究对象的全体称为总体(或母体),而把组成总体的每一个单元(或元素)称为个体。

2.样本

为了研究总体的情况,一般只能在这个总体中抽取出一定数量的个体进行观测此过程称为抽样(也称取样、采样)

3.统计量

样本是对总体进行统计分析和推断的依据,但在处理具体的理论和应用问题时,却很少直接利用样本所提供的原始数据,而是要对这些数据进行加工、提炼,把样本中所包含的有关信息集中起来。这便是针对不同问题构造样本的某种函数。样本的函数常称为统计量。


三、常用统计分布分析

常用统计分布之 X2分布

定义1设随机变量1,范2,…n 独立、同分布,;~N(O,1)(i =1 2 ...,n)

则随机变量image.png

所服从的分布称为自由度是nx2分布,而且这个随机变量称为x2变量,简记为 x2~x 2(n)

常用统计分布之 t 分布

定义2,n 独立,~N(O,1)n~X 2(n),则随机变量

T=image.png

称为自由度为 n t 变量,它所服从的分布称为 t 分布,通常记为 t~t( n)

常用统计分布之F分布

定义3 ,n 独立,~x 2(m),n~x 2(n),则随机变量

image.png

称为自由度为(m, n)F 变量,它所服从的分布称为F分布,通常记作 F~ F(m, n),其中 m 称为第一自由度, n 称为第二自由度。


四、抽样分布之正态总体的样本均值与方差的分布

本段就总体服从正态分布的情形进行讨论

定理1设随机变量1,t2,".n 相互独立,

image.png

则它们的任一确定的线性函数

image.png

其中常数 k, k2",kn 不全为零。


五、参数评估

根据样本推断总体的分布或分布的数字特征称为统计推断。它是数理统计学的核心。有一类统计推断问题是总体的分布函数或概率函数的数学表达式为已知,但它的某些参数(总体的数字特征也作为参数)却未知,我们要求对未知参数或未知参数的函数进行估计,这类问题称为参数估计问题。

参数估计分为点估计与区间估计两种。本章主要介绍求估计量的方法、估计量优劣的评判标准和总体均值与方差的区间估计。


六、区间估计之正态总体均值的区间估计

本段总是假定总体N(u ,image.png2) u为未知数,而(1 ,2 ,... ,n)为的一个样本。

(1). image.png2已知,求u的置信区间

(2). image.png2未知,求u的置信区间

区间估计之两个正态总体均值差的区间估计

设总体image.pngimage.png的容量为n1的样

;又设另一个总体image.png的容量为image.png的样本。且设这两个样本独立。

设总体image.pngimage.png的容量为n1的样本;又设另一总体image.pngn的容量为n2的样本;且设这两个样本相互独立,image.png分别为这两个样本的修正样本方差﹒在参数image.png都为未知时,我们来求方差比image.png1 - α置信区间。


七、假设检验的基本原理

不论假设是怎么样的,进行检验的基本思想却是一个,就是所谓概率性质的反证法:

为了检验原假设 H0是香正确,我们先假定这个假设 H0为正确,看由此能推出什么结果,如果导致一个不合理现象的出现,则表明“假设 H0

为正确”是错误的,即原假设 H0不正确,因此我们拒绝原假设 H0。如果没有导致不合理现象出现,则不能认为原假设 H0不正确,因为我们不拒绝 H0,此时根据问题的需要或作进一步的试验考察或接受 H0


八、两类错误

1)原 H0。本来是正确的,但我们却拒绝了 H0,这就犯了错误。这类错误称为拒真(弃真)错误,也称为第一类错误。

其发生概率称为拒真概率或犯第一类错误的概率,通常记为α,即 P{拒绝 H0│H0为真}=α

(2)原假设 H0本来不正确,但我们却接受了 H0,这类错误称为纳伪错误,也称为第二类错误﹒其发生的概率称纳伪概率或犯第二类错误的概率,通常记为β,即 Р{接受 H0|H0不真}=β


九、假设检验的一般步骤

1.根据问题的要求提出原假设 H0与备择假设 H1

2.构造检验统计量与确定拒绝域的形式

3.选定适当的显著性水平 α,并求出临界值

4.根据样本观测值确定是否拒绝 H0方差image.png2为已知时均值μ的假设检验image.png2为已知时,

在给定显著性水平 α 下,关于正态总体均值的常见的假设检验问题有三类:

1)双侧检验

2)右侧检验

3)左侧检验

相关文章
|
JavaScript 前端开发
vue2.0 + element-ui 多级导航菜单
vue2.0 + element-ui 多级导航菜单
300 0
|
设计模式 Android开发
[Android 四大组件] --- BroadcastReceiver
[Android 四大组件] --- BroadcastReceiver
152 0
|
6月前
|
开发框架 前端开发 JavaScript
【HarmonyOS Next之旅】基于ArkTS开发(二) -> UI开发一
本文介绍了方舟开发框架(ArkUI)及其两种开发范式:基于ArkTS的声明式开发范式和类Web开发范式。ArkUI是用于构建HarmonyOS应用界面的UI框架,提供极简UI语法和基础设施。声明式开发范式使用ArkTS语言,以组件、动画和状态管理为核心,适合复杂团队协作;类Web开发范式采用HML、CSS、JavaScript三段式开发,适用于简单界面应用,贴近Web开发者习惯。文中还概述了两者的架构和基础能力,帮助开发者选择合适的范式进行高效开发。
221 15
|
机器学习/深度学习 算法 TensorFlow
机器学习算法简介:从线性回归到深度学习
【5月更文挑战第30天】本文概述了6种基本机器学习算法:线性回归、逻辑回归、决策树、支持向量机、随机森林和深度学习。通过Python示例代码展示了如何使用Scikit-learn、statsmodels、TensorFlow库进行实现。这些算法在不同场景下各有优势,如线性回归处理连续值,逻辑回归用于二分类,决策树适用于规则提取,支持向量机最大化类别间隔,随机森林集成多个决策树提升性能,而深度学习利用神经网络解决复杂模式识别问题。理解并选择合适算法对提升模型效果至关重要。
441 4
|
安全 Windows
搜狗输入法双击输入框崩溃问题
【8月更文挑战第27天】搜狗输入法双击输入框崩溃可能由多种因素造成,包括软件冲突、输入法版本问题、系统故障、设置错误及硬件问题。建议检查并解决潜在冲突软件,更新输入法版本,修复系统文件,调整输入法设置,以及确保硬件正常工作。通过逐步排查,通常可定位并解决问题。
627 0
|
存储 负载均衡 并行计算
实现优雅并行编程:确保正确性与提升性能的关键要素
在程序开发中,并行编程一种利用多个处理器或计算资源同时执行多个任务的编程方式,它能够提高计算效率和性能,是提高计算效率和性能的关键手段,但它也带来了一系列复杂的问题,涉及到任务分解、数据同步、资源分配等诸多复杂问题,稍有不慎就可能导致性能瓶颈、死锁甚至数据不一致等状况。编写优雅的并行程序需要在保证程序正确性的前提下,实现高效的并行计算。那么本文就来探讨一下如何在保证程序正确性的前提下,实现优雅的并行程序,以提升计算效率和性能,包括任务分解、数据同步和资源分配等方面的关键要素,希望能够为读者提供一些有用的指导和启示。
334 2
实现优雅并行编程:确保正确性与提升性能的关键要素
|
存储 算法 计算机视觉
Baumer工业相机堡盟工业相机软件CameraExplorer常见功能使用说明一
Baumer工业相机堡盟工业相机软件CameraExplorer常见功能使用说明一
489 0
|
移动开发 自然语言处理 小程序
如何制作产品介绍二维码(二):二维码设置、美化及管理
这篇教程介绍了如何使用官方模板“产品详情介绍”创建产品介绍二维码,内容包括编辑内容、二维码设置、样式美化和后台管理四个步骤。在二维码设置中,涉及有效期、查看权限、地区限制和打开方式等选项。样式美化则涵盖更换标签样式和内容修改。后台管理允许修改二维码内容和查看扫描统计数据。
535 1
|
C++
Qt6学习笔记十(鼠标事件、事件分发器)
Qt6学习笔记十(鼠标事件、事件分发器)
261 0
|
JavaScript
【组件封装】vue打字机效果和文字发光
【组件封装】vue打字机效果和文字发光
【组件封装】vue打字机效果和文字发光