开发者学堂课程【人工智能必备基础:概率论与数理统计:二项式分布】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/545/detail/7423
二项式分布
内容介绍
一、定义
二、公式
一、定义
玩板球这个例子。假设你今天赢了一场比赛,这表示一个成功的事件。你再比了一场,但你输了。如果你今天赢了一场比赛,但这并不表示你明天肯定会赢。我们来分配一个随机变量X,用于表示赢得的次数。可能的值是多少呢?它可以是任意值,这取决于你掷硬币的次数。
只有两种可能的结果,成功和失败。因此,成功的概率=0.5,失败的概率可以很容易地计算得到: q=p-1=0.5.
二项式分布就是只有两个可能结果的分布,比如成功或失败、得到或者丢失、赢或败,每一次尝试成功和失败的概率相等。
结果有可能不一定相等。如果在实验中成功的概率为 0.2,则失败的概率可以很容易地计算得到 q=1-0.2=0.8.
每一次尝试都是独立的,因为前一次投掷的结果不能决定或影响当前投掷的结果。只有两个可能的结果并凡重复 n 次的实验叫做二项式。一项分布的参数是 n 和 p 其中n是试验的总数,p 是每次试验成功的概率。
在上述说明的基础上,项式分布的属性包括:
1.每个试验都是独立的。
2.在试验中只有两个可能的结果;成功或失败。总共进行了 n 次相同的试验
3.所有试验成功和失败的概率是相同的。(试验是一样的)
二、公式
1.PMF (概率质量函数):是对离散随机变量的定义,是离散型随机变量在各个特定取值的概,该的数通俗来说,就是对于一个离散型事事件来说,使用这个的数来求它的各个成功事件结果的概率
2.PDF (概率密度函数):是对连续型随机变量的定义、与 PMF 不同的是 PDF 在特定点上的值并不是该点的概率,连续随机概率事件只能求一段区域内发生事件的概率,通过对这段区间进行积分来求!通俗说,使用这个概率密度的数将想要求概率的区间的临界点(最大值和最小值)带入求积分,就是该区间的概率。
// p是 0-1 的值,是成功的概率
P 对结果的影响
P 的概率越小,最后结果赢的概率越小
N 对结果的影响
N 越大,图像在逐渐变得平缓
随机样本 (Random Variates)
In [15]: import numpy as np
from scipy.stats import binom
# drar a single sample np.random.seed(42)
print(binomrvs(p=0.3,n=10),end="\n\n”)
# drar 1o sauples
print(binom.rvs(p=0.3,n=10, size=10),end=\n\n)
2
【5432215340】