概率统计——重要术语及解释

2023-05-20 496

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 概率统计——重要术语及解释

文章目录

基本术语

1. 随机试验 Random Experiment

2. 样本空间与样本点 Sample Space & Sample Point

3. 基本事件、随机事件、必然事件、不可能事件 Elementary Event / Random Event / Certain Event / Impossible Event

4. 对立事件、互斥事件 Complementary Event / Mutually Exclusive Event

5. 事件的运算

6. 频率与概率 Frequency & Probability

7. 概率的性质

8. 等可能概型（古典概型） Classical Probability

9. 放回抽样、不放回抽样 Sampling With Replacement / Sampling Without Replacement

10. 实际推断原理 Practical Deducing Principle

11. 条件概率 Conditional Probability

11. 概率乘法公式 Probability Multiplication Formula

13. 事件独立性 Independence of Event

14. 全概率与贝叶斯公式 Total Probability Formula & Bayes Formula

15. 排列与组合 Permutation & Combination

16. 随机变量 Random Variable

17. 概率密度函数 Probability Density Function

18. 分布函数 Distribution Function

19. 伯努利试验与二项分布 Bernoulli Trial & Binomial Distribution

20. 几何分布 Geometric Distribution

21. 泊松分布 Poisson Distribution

22. 不放回抽样分布 Hypergeometric Distribution

正文

基本术语

1. 随机试验 Random Experiment

随机试验是可重复进行的、所有可能性已知，但试验结果未知的试验。

2. 样本空间与样本点 Sample Space & Sample Point

随机试验的所有可能结果组成的集合称为样本空间，其中每个可能结果称为一个样本点。

3. 基本事件、随机事件、必然事件、不可能事件 Elementary Event / Random Event / Certain Event / Impossible Event

（1）基本事件：

随机试验中，样本空间的一个样本点，称为该试验的一个基本事件，当在一次随机试验中出现了这个样本点，则称该基本事件发生。

（2）随机事件：

随机试验中，样本空间的一个子集，称为该试验的一个随机事件，当在一次随机试验中出现了该子集中的一个样本点，则称该随机事件发生。

（3）必然事件：

随机试验中，样本空间的全集，称为该试验的必然事件，任意一次随机试验中出现的样本点都必然在这个全集中。

（4）不可能事件：

随机试验中，样本空间的空集，称为该试验的不可能事件，任意一次随机试验中出现的样本点都不可能在这个空集中。

4. 对立事件、互斥事件 Complementary Event / Mutually Exclusive Event

1）对立事件

随机试验中的多个事件必有，且仅有一个发生，则这些事件互为对立事件。

（2）互斥事件

随机试验中的多个事件不能同时发生，则它们为互斥事件，基本事件是互斥的。

（3）对立事件与互斥事件的关系。

对立事件一定是互斥事件，互斥事件不一定是对立事件。

5. 事件的运算

（1）取交集 ∩

A∩B={x∣x∈A且x∈B}

通常，P ( A ∩ B ) 记为P ( A B ) ，例如P ( A ∩ Ω ) 记为P ( A )

（2）取并集 ∪

（3）交换律

（4）结合律

（5）分配律

（6）德摩根律

6. 频率与概率 Frequency & Probability

（1）频率

在随机试验中，设某随机事件发生的次数为频数m，则m与试验次数n 的比值m /n 称作频率。

（2）概率

表示随机试验中，某随机事件发生的可能性。

（3）频率与概率的关系

可以简单理解为，频率就是随机试验结果的真值，概率就是随机试验结果的预测。由大数定理可以证明，当随机试验次数足够多时，频率收敛于概率，即一般情况下我们认为：频率=概率。

7. 概率的性质

（1）空集概率为0

P(∅)=0

（2）概率小于1

P(A)⩽1

（3）有限可加公式

4）减法公式

若P ( B ) > P ( A )，则有

（5）逆事件概率公式

（6）并事件概率公式

8. 等可能概型（古典概型） Classical Probability

样本空间有限，且每个基本事件发生的概率相等的随机试验，称为等可能概型（古典概型）。其计算公式为：

9. 放回抽样、不放回抽样 Sampling With Replacement / Sampling Without Replacement

（1）放回抽样：

样本点从样本空间中取出后，放回样本空间中，再进行下一次抽样的抽样方式，称为放回抽样。

（2）不放回抽样：

样本点从样本空间中取出后，不放回样本空间中，下一次抽样从除去被取出样本点的样本空间中进行抽样的抽样方式，称为不放回抽样

10. 实际推断原理 Practical Deducing Principle

小概率事件在一次随机试验中不发生.

11. 条件概率 Conditional Probability

某一事件发生后，另一事件再发生的概率，称为条件概率。例如B事件发生后，A事件再发生的概率记为：

P ( A ∣ B )

读作在B 条件下A 的概率。

12. 概率乘法公式 Probability Multiplication Formula

13. 事件独立性 Independence of Event

事件之间相互独立，是指事件之间相互无影响。例如有两事件A AA、B BB相互独立，则它们的独立性直观体现它们的条件概率为自身概率：

此时，概率乘法公式可以表示为：

14. 全概率与贝叶斯公式 Total Probability Formula & Bayes Formula

（1）全概率公式：

全概率公式将复杂事件的概率求解问题，转化为了对不同条件下简单事件的概率进行求和，表示为：

2）贝叶斯公式：

贝叶斯公式以全概率公式为中介，描述两个条件概率之间的关系。用于已知条件概率P ( B ∣ A i )，求P ( A i ∣ B ) ，表示为：

其原理在于，在全部随机试验∑ j P ( B ∣ A j ) P ( A j ) 中，支持某条件P ( A i ) 成立的事件P ( B ∣ A i ) P)越多，则已发生事件的条件P ( A i ∣ B ) P越有可能成立。

15. 排列与组合 Permutation & Combination

（1）排列：

从n 个不同元素中，任取m mm个不同的元素按顺序排成一列

（2）组合：

从n个不同元素中，任取m个元素不管顺序并成一组

16. 随机变量 Random Variable

是将现实试验中的各种可能情况映射到实数空间的一个实值函数，以方便对现实世界的概率分布情况做数学表达和处理。

17. 概率密度函数 Probability Density Function

概率密度函数是由频率密度直方图在组距趋向于无穷小时得到的函数曲线。它具有频率密度直方图的一切性质，其中最重要的性质是面积等于概率（频率）。

需特别说明的是，概率密度函数上某一点的横坐标，实际上指的是该坐标的领域，该横坐标与对应的函数值相乘即为该点的概率。

18. 分布函数 Distribution Function

即在实数域内，随机变量值小于等于某个特定值的概率，这个概率可通过计算概率密度函数的面积得到，即对概率密度函数进行积分。

19. 伯努利试验与二项分布 Bernoulli Trial & Binomial Distribution

只有两种结果的试验称为伯努利试验，试验结果的分布规律称为0-1分布。

当将伯努利试验进行n nn次时，这样的试验称为n nn重伯努利试验，试验结果的分布规律称为二项分布。一般来说，二项分布的概率计算涉及的幂级较高，难以计算，通常通过泊松分布或标准正态分布来近似计算。

20. 几何分布 Geometric Distribution

几何分布，是指不断重复做伯努利实验，直到所期待的某个事件发生的分布规律。表示为：

中，( 1 − p ) k − 1 是指前k − 1 k-次伯努利试验该事件没有发生。

21. 泊松分布 Poisson Distribution

泊松分布，用于计算n nn大，p pp小的二项分布。一般来说，当n > 100 , p < 0.1 n > 100,p<0.1n>100,p<0.1时，满足用泊松分布近似计算二项分布的条件。表示为：

其中λ = n p

22. 不放回抽样分布 Hypergeometric Distribution

又称超几何分布，用于表示对两类元素进行不放回抽样，所产生取样结果的分布规律。表示为：

当n 远小于N 时，是否放回对抽样结果几乎无影响，此时可用二项分布来近似不放回抽样分布，表示为：

概率统计——重要术语及解释

文章目录

正文