概率统计——重要术语及解释

简介: 概率统计——重要术语及解释

文章目录


基本术语

1. 随机试验 Random Experiment

2. 样本空间与样本点 Sample Space & Sample Point

3. 基本事件、随机事件、必然事件、不可能事件 Elementary Event / Random Event / Certain Event / Impossible Event

4. 对立事件、互斥事件 Complementary Event / Mutually Exclusive Event

5. 事件的运算

6. 频率与概率 Frequency & Probability

7. 概率的性质

8. 等可能概型(古典概型) Classical Probability

9. 放回抽样、不放回抽样 Sampling With Replacement / Sampling Without Replacement

10. 实际推断原理 Practical Deducing Principle

11. 条件概率 Conditional Probability

11. 概率乘法公式 Probability Multiplication Formula

13. 事件独立性 Independence of Event

14. 全概率与贝叶斯公式 Total Probability Formula & Bayes Formula

15. 排列与组合 Permutation & Combination

16. 随机变量 Random Variable

17. 概率密度函数 Probability Density Function

18. 分布函数 Distribution Function

19. 伯努利试验与二项分布 Bernoulli Trial & Binomial Distribution

20. 几何分布 Geometric Distribution

21. 泊松分布 Poisson Distribution

22. 不放回抽样分布 Hypergeometric Distribution


正文


基本术语


1. 随机试验 Random Experiment


随机试验是可重复进行的、所有可能性已知,但试验结果未知的试验。


2. 样本空间与样本点 Sample Space & Sample Point


随机试验的所有可能结果组成的集合称为样本空间,其中每个可能结果称为一个样本点。


3. 基本事件、随机事件、必然事件、不可能事件 Elementary Event / Random Event / Certain Event / Impossible Event


(1)基本事件:

随机试验中,样本空间的一个样本点,称为该试验的一个基本事件,当在一次随机试验中出现了这个样本点,则称该基本事件发生。


(2)随机事件:

随机试验中,样本空间的一个子集,称为该试验的一个随机事件,当在一次随机试验中出现了该子集中的一个样本点,则称该随机事件发生。


(3)必然事件:

随机试验中,样本空间的全集,称为该试验的必然事件,任意一次随机试验中出现的样本点都必然在这个全集中。


(4)不可能事件:

随机试验中,样本空间的空集,称为该试验的不可能事件,任意一次随机试验中出现的样本点都不可能在这个空集中。


4. 对立事件、互斥事件 Complementary Event / Mutually Exclusive Event


1)对立事件

随机试验中的多个事件必有,且仅有一个发生,则这些事件互为对立事件。

(2)互斥事件

随机试验中的多个事件不能同时发生,则它们为互斥事件,基本事件是互斥的。

(3)对立事件与互斥事件的关系。

对立事件一定是互斥事件,互斥事件不一定是对立事件。


5. 事件的运算


(1)取交集

A∩B={x∣x∈A且x∈B}

通常,P ( A ∩ B ) 记为P ( A B ) ,例如P ( A ∩ Ω ) 记为P ( A )

(2)取并集

443.png


(3)交换律

444.png

(4)结合律

445.png

(5)分配律

446.png

(6)德摩根律

447.png


6. 频率与概率 Frequency & Probability


(1)频率

在随机试验中,设某随机事件发生的次数为频数m,则m与试验次数n 的比值m /n  称作频率。


(2)概率

表示随机试验中,某随机事件发生的可能性。


(3)频率与概率的关系


可以简单理解为,频率就是随机试验结果的真值,概率就是随机试验结果的预测。由大数定理可以证明,当随机试验次数足够多时,频率收敛于概率,即一般情况下我们认为:频率=概率。


7. 概率的性质


(1)空集概率为0

P(∅)=0

(2)概率小于1

P(A)⩽1

(3)有限可加公式

333.png

4)减法公式

若P ( B ) > P ( A ),则有

334.png

(5)逆事件概率公式

335.png

(6)并事件概率公式

336.png


8. 等可能概型(古典概型) Classical Probability


样本空间有限,且每个基本事件发生的概率相等的随机试验,称为等可能概型(古典概型)。其计算公式为:111.png


9. 放回抽样、不放回抽样 Sampling With Replacement / Sampling Without Replacement


(1)放回抽样:

样本点从样本空间中取出后,放回样本空间中,再进行下一次抽样的抽样方式,称为放回抽样。

(2)不放回抽样:

样本点从样本空间中取出后,不放回样本空间中,下一次抽样从除去被取出样本点的样本空间中进行抽样的抽样方式,称为不放回抽样


10. 实际推断原理 Practical Deducing Principle


小概率事件在一次随机试验中不发生.


11. 条件概率 Conditional Probability


某一事件发生后,另一事件再发生的概率,称为条件概率。例如B事件发生后,A事件再发生的概率记为:

P ( A ∣ B )

读作在B 条件下A 的概率。


12. 概率乘法公式 Probability Multiplication Formula


112.png


13. 事件独立性 Independence of Event


事件之间相互独立,是指事件之间相互无影响。例如有两事件A AA、B BB相互独立,则它们的独立性直观体现它们的条件概率为自身概率:

113.png

此时,概率乘法公式可以表示为:

123.png


14. 全概率与贝叶斯公式 Total Probability Formula & Bayes Formula


(1)全概率公式:

全概率公式将复杂事件的概率求解问题,转化为了对不同条件简单事件的概率进行求和,表示为:

222.png


2)贝叶斯公式:

贝叶斯公式以全概率公式为中介,描述两个条件概率之间的关系。用于已知条件概率P ( B ∣ A i ),求P ( A i ∣ B ) ,表示为:

223.png


其原理在于,在全部随机试验∑ j P ( B ∣ A j ) P ( A j ) 中,支持某条件P ( A i ) 成立的事件P ( B ∣ A i ) P)越多,则已发生事件的条件P ( A i ∣ B ) P越有可能成立。


15. 排列与组合 Permutation & Combination


(1)排列:

从n 个不同元素中,任取m mm个不同的元素按顺序排成一列

212.png


(2)组合:

从n个不同元素中,任取m个元素不管顺序并成一组

213.png


16. 随机变量 Random Variable


是将现实试验中的各种可能情况映射到实数空间的一个实值函数,以方便对现实世界的概率分布情况做数学表达和处理。


17. 概率密度函数 Probability Density Function


概率密度函数是由频率密度直方图在组距趋向于无穷小时得到的函数曲线。它具有频率密度直方图的一切性质,其中最重要的性质是面积等于概率(频率)

需特别说明的是,概率密度函数上某一点的横坐标,实际上指的是该坐标的领域,该横坐标与对应的函数值相乘即为该点的概率。


18. 分布函数 Distribution Function


即在实数域内,随机变量值小于等于某个特定值的概率,这个概率可通过计算概率密度函数的面积得到,即对概率密度函数进行积分。


19. 伯努利试验与二项分布 Bernoulli Trial & Binomial Distribution


只有两种结果的试验称为伯努利试验,试验结果的分布规律称为0-1分布。


当将伯努利试验进行n nn次时,这样的试验称为n nn重伯努利试验,试验结果的分布规律称为二项分布。一般来说,二项分布的概率计算涉及的幂级较高,难以计算,通常通过泊松分布或标准正态分布来近似计算。


20. 几何分布 Geometric Distribution


几何分布,是指不断重复做伯努利实验,直到所期待的某个事件发生的分布规律。表示为:54.png

中,( 1 − p ) k − 1 是指前k − 1 k-次伯努利试验该事件没有发生。


21. 泊松分布 Poisson Distribution


泊松分布,用于计算n nn大,p pp小的二项分布。一般来说,当n > 100 , p < 0.1 n > 100,p<0.1n>100,p<0.1时,满足用泊松分布近似计算二项分布的条件。表示为:

45.png

其中λ = n p


22. 不放回抽样分布 Hypergeometric Distribution


又称超几何分布,用于表示对两类元素进行不放回抽样,所产生取样结果的分布规律。表示为:

43.png


当n 远小于N 时,是否放回对抽样结果几乎无影响,此时可用二项分布来近似不放回抽样分布,表示为:

44.png

相关文章
|
4月前
|
机器学习/深度学习 算法
【机器学习】解释对偶的概念及SVM中的对偶算法?(面试回答)
解释了对偶的概念,指出对偶性在优化问题中的重要性,尤其是在强对偶性成立时可以提供主问题的最优下界,并且详细阐述了支持向量机(SVM)中对偶算法的应用,包括如何将原始的最大间隔优化问题转换为对偶问题来求解。
100 2
|
6月前
|
编解码 开发工具 git
技术心得记录:小波变换(wavelettransform)的通俗解释(一)
技术心得记录:小波变换(wavelettransform)的通俗解释(一)
55 0
|
算法
lingo中的一些概念解释
lingo中的一些概念解释
114 0
解读量子力学:哥本哈根解释与多世界解释
无论选择哪种解释,量子力学依然是一个极为成功的理论,能够准确描述微观世界的行为。不同的解释视角提供了对量子力学的不同解读,激发了科学家们对于量子世界本质的思考和探索。
197 1
解读量子力学:哥本哈根解释与多世界解释
|
编解码 JavaScript
解释基本的3D理论
本文介绍了所有基本理论,这些理论在开始使用 3D 时很有用。
123 0
解释基本的3D理论
|
算法 索引 Python
从一道简单算法题里面解释什么叫做 O(1)
从一道简单算法题里面解释什么叫做 O(1)
126 0
|
机器学习/深度学习 算法
LSTM最通俗的解释
LSTM最通俗的解释
|
机器学习/深度学习 数据可视化 算法
SHAP值:用博弈论的概念解释一个模型
SHAP值:用博弈论的概念解释一个模型
704 0
SHAP值:用博弈论的概念解释一个模型
|
机器学习/深度学习 存储 分布式计算
概率图模型-推断|机器学习推导系列(十一)
概率图模型-推断|机器学习推导系列(十一)
215 0
概率图模型-推断|机器学习推导系列(十一)
|
机器学习/深度学习 算法 前端开发
通俗解释随机森林算法
通俗解释随机森林算法
391 0
通俗解释随机森林算法