大数定律与中心极限定理

简介: 大数定律与中心极限定理

正文


大数定律


定义:

设X 1 , X 2 , . . . , X n , . . .为随机变量序列,X XX为随机变量,若对任意的正数ϵ 有:

8.png

9.png

则称X n 依概率收敛于X ,记为


10.png

11.png


切比雪夫不等式


由于方差D ( X ) 用来描述随机变量X 的取值在其数学期望E ( X ) 附件的离散程度的,因此,对任意的正数ϵ \epsilonϵ,事件( ∣ X − E ( X ) ∣ ⩾ ϵ ) 发生的概率应该与D ( X ) 有关,而这种关系用数学形式表示出来,就是切比雪夫不等式。


切比雪夫不等式定理


设随机变量X 的数学期望E ( X ) 与方差D ( X ) 存在,则对于任意正数ϵ ,不等式

12.png

13.png

都成立,且这两个不等式称为切比雪夫不等式


切比雪夫不等式的重要意义


切比雪夫不等式给出了在随机变量X 的分布未知的情况下,只利用X XX的数学期望和方差即可对X XX的概率分布进行估值的方法。


切比雪夫大数定律


切比雪夫大数定律定理


设独立随机变量序列X 1 , X 2 , . . .的数学期望E ( X 1 ) , E ( X 2 ) , . . . 和方差D ( X 1 ) , D ( X 2 ) , . . . D都存在,并且方差是一致有上界的,即存在常数C ,使得D ( X i ) ⩽ C , i = 1 , 2 , . . . , n . . .则对于任意的正数ϵ \epsilonϵ,有

14.png

切比雪夫大数定律的统计意义


独立随机变量序列X 1 , X 2 , . . . , X n , . . .的数学期望与方差都存在,且方差一致有上届,则经过算术平均后得到的随机变量

15.png


当n 充分大时,它的值将比较紧密地聚集在它的数学期望E ( X ‾ )附件。


伯努利大数定律


伯努利大数定律是切比雪夫大数定律的一个重要推论


伯努利大数定律定理


设 n_A 为n 重伯努利试验中事件A 发生的次数,又设在每次试验中事件A 发生的概率P ( A ) = p,则对于任意的正数ϵ \epsilonϵ,当试验的次数n → ∞ 时,有

16.png


伯努利大数定律的统计意义


当试验在相同条件下重复进行很多次时,随机事件A 的频率f n ( A ) = n A/ n ,将稳定在事件A 的概率P ( A ) = p 附近,即频率收敛于概率。


中心极限定理


中心极限定理是研究独立随机变量和的极限分布为正态分布的命题。

经过科学家长期的观察和总结,发现服从正态分布的随机现象往往是由独立(或弱相依)的随机变量产生的。

这类随机现象往往可视为独立随机变量之和17.png在什么条件下渐进于正态分布的问题。为使问题规范化,数学家们将问题归结为讨论规范和18.png有渐进分布N ( 0 , 1 )的条件,并称有此结论的随机序列{ x n }服从中心极限定理。即:


19.png


独立同分布的中心极限定理(林德贝格-勒维中心极限定理)

设{ x n } 是独立同分布的随机变量序列,且E ( x i ) = μ , D ( x i ) = σ 2 , i = 1 , 2 , . . . n ,则随机变量20.png的分布函数F n ( x )收敛于标准正态分布的分布函数Φ ( x ).即对于任意的实数x 有:


21.png

n 充分大时,有:

1.随机变量22.png23.png

24.png

德莫佛-拉普拉斯中心极限定理


设在独立试验序列中,事件A 发生的概率为p ,随机变量n A 表示事件A 在n 次试验中发生的次数,即n A 服从二项分布,则对任意实数x ,有:


25.png

当n 充分大时,服从二项分布的随机变量n A  将近似地服从正态分布,因此当n nn较大时,可以用正态分布来近似地计算二项分布:

26.png

相关文章
|
8天前
荷花定律
荷花定律
11 0
|
9月前
Amdahl定律(阿姆达尔定律)
Amdahl定律(阿姆达尔定律)
|
7月前
基尔霍夫定律
基尔霍夫定律(Kirchhoff's laws)是电路理论中的两个基本定律,分别是基尔霍夫电流定律和基尔霍夫电压定律。这两个定律是分析和解决电路中电流和电压分布的基础。
59 0
粗略估计哥德巴赫猜想的成立(伯特兰-切比雪夫定理、质数密度定理)
粗略估计哥德巴赫猜想的成立(伯特兰-切比雪夫定理、质数密度定理)
159 0
|
算法 并行计算 测试技术
阿姆达尔定律和古斯塔夫森定律
摘要 构建软件的并行版本可使应用在更短的时间内运行指定的数据集,在固定时间内运行多个数据集,或运行非线程软件禁止运行的大型数据集。 并行化的成功通常通过测量并行版本的加速(相对于串行版本)来进行量化。
1279 0