二项式分布 | 学习笔记

简介: 快速学习二项式分布

开发者学堂课程【人工智能必备基础:概率论与数理统计:二项式分布】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7423


二项式分布

内容介绍

一、定义

二、公式

 

一、定义

玩板球这个例子。假设你今天赢了一场比赛,这表示一个成功的事件。你再比了一场,但你输了。如果你今天赢了一场比赛,但这并不表示你明天肯定会赢。我们来分配一个随机变量X,用于表示赢得的次数。可能的值是多少呢?它可以是任意值,这取决于你掷硬币的次数。

只有两种可能的结果,成功和失败。因此,成功的概率=0.5,失败的概率可以很容易地计算得到: q=p-1=0.5.

二项式分布就是只有两个可能结果的分布,比如成功或失败、得到或者丢失、赢或败,每一次尝试成功和失败的概率相等。

结果有可能不一定相等。如果在实验中成功的概率为 0.2,则失败的概率可以很容易地计算得到 q=1-0.2=0.8.

每一次尝试都是独立的,因为前一次投掷的结果不能决定或影响当前投掷的结果。只有两个可能的结果并凡重复 n 次的实验叫做二项式。一项分布的参数是 n 和 p 其中n是试验的总数,p 是每次试验成功的概率。

在上述说明的基础上,项式分布的属性包括:

1.每个试验都是独立的。

2.在试验中只有两个可能的结果;成功或失败。总共进行了 n 次相同的试验

3.所有试验成功和失败的概率是相同的。(试验是一样的)

 

二、公式

image.png

1.PMF (概率质量函数):是对离散随机变量的定义,是离散型随机变量在各个特定取值的概,该的数通俗来说,就是对于一个离散型事事件来说,使用这个的数来求它的各个成功事件结果的概率

2.PDF (概率密度函数):是对连续型随机变量的定义、与 PMF 不同的是 PDF 在特定点上的值并不是该点的概率,连续随机概率事件只能求一段区域内发生事件的概率,通过对这段区间进行积分来求!通俗说,使用这个概率密度的数将想要求概率的区间的临界点(最大值和最小值)带入求积分,就是该区间的概率。

// p是 0-1 的值,是成功的概率

image.png

P 对结果的影响

P 的概率越小,最后结果赢的概率越小

image.png

N 对结果的影响

image.png

N 越大,图像在逐渐变得平缓

随机样本 (Random Variates)

In [15]: import numpy as np

from scipy.stats import binom

# drar a single sample np.random.seed(42)

print(binomrvs(p=0.3,n=10),end="\n\n”)

# drar 1o sauples

print(binom.rvs(p=0.3,n=10, size=10),end=\n\n)

2

【5432215340】

image.png

相关文章
【概率论基础】Probability | 数学性概率 | 统计性概率 | 几何概率 | 概率论三大公理
【概率论基础】Probability | 数学性概率 | 统计性概率 | 几何概率 | 概率论三大公理
130 0
|
7月前
|
数据可视化
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
R语言极值推断:广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法
|
7月前
|
数据可视化
R语言可视化渐近正态性、收敛性:大数定律、中心极限定理、经验累积分布函数
R语言可视化渐近正态性、收敛性:大数定律、中心极限定理、经验累积分布函数
三大抽样分布——卡方分布、t分布、F分布
三大抽样分布——卡方分布、t分布、F分布
|
数据可视化 Python
概率学中的随机变量与分布
概率学中的随机变量与分布
概率学中的随机变量与分布
|
存储 BI
概率论和统计学中重要的分布函数
概率论和统计学中重要的分布函数
251 0
概率论和统计学中重要的分布函数
18 误差分布曲线的建立 - 拉普拉斯的研究
18 误差分布曲线的建立 - 拉普拉斯的研究
62 0
|
数据挖掘 数据处理
17 误差分布曲线的建立 - 辛普森的研究
17 误差分布曲线的建立 - 辛普森的研究
98 0
(一)探索随机变量及其分布:概率世界的魔法
(一)探索随机变量及其分布:概率世界的魔法
|
Serverless
第8章 概率统计——8.2 概率密度计算
第8章 概率统计——8.2 概率密度计算