通过实例理解如何选择正确的概率分布

简介: 通过实例理解如何选择正确的概率分布

640.png


概率分布

概率分布是描述获得事件可能值的数学函数。概率分布可以是离散的,也可以是连续的。离散分布是指数据只能取某些值,而连续分布是指数据可以取特定范围内的任何值(可能是无限的)。

离散概率分布有很多种。离散概率分布的使用取决于数据的属性。例如,使用:

  • 二项分布,计算在每次试验中只有两种可能结果之一的过程的概率,例如掷硬币。
  • 超几何分布,以找出在n次不替换的抽取中k次成功的概率。
  • 泊松分布,测量给定时间内发生给定事件数的概率,例如每小时图书馆借书的计数。
  • 几何分布,确定在第一次成功之前一定数量的试验发生的概率。

二项分布

二项分布可能是所有离散分布中最广为人知的。它是一种有两种可能结果的分布。使用二项分布的一个典型例子是抛硬币。抛硬币只有两种可能的结果:正面或反面,每种结果的概率都是1/2。让我们看看什么时候可以使用二项分布!

二项分布的主要特征:

  • 这个实验包括n次相同的试验。
  • 每次试验只有两种可能的结果,即成功或失败。
  • 试验是相互独立的。
  • p表示为成功的概率,在两次试验之间保持不变,q = (1 - p)为每次试验失败的概率。

640.png


例子

问:一家仓库运送了10台印刷机,其中4台有缺陷。本公司随机挑选5台机器,如果全部5台机器都没有缺陷,则接受发货。

找出公司在抽样和替换时接受货物的概率。

我将使用以下公式:试验次数n是5,机器出现故障的概率p是4/10,所以q是6/10,x = 5。

640.png


超几何分布

超几何分布与二项分布非常相似。超几何分布和二项分布都描述了一个事件在固定次数的试验中发生的次数。二项分布每次试验的概率都是一样的。相比之下,在超几何分布中,每次试验都会改变每次后续试验的概率,因为没有替代。

超几何分布的主要特征:

  • 考虑N= N1 + N2个相似对象的集合,其中N1个属于两个二分类中的一个,N2个属于第二类。
  • 从这n个对象中随机选择的n个对象的集合,不进行替换。


640.png

例子

问:让我们稍微改变一下之前的问题。如果我们现在不更换样品,公司接受这批货的概率是多少?

我们知道机器的总数N是10台,随机选择要测试的机器数N是5台。设N1为无缺陷,N2为缺陷,即N1 =6, N2= 10- N1 =4。为了让公司接受这批货,我们不能有任何有缺陷的机器。所有不合格机的选择方法为6C5, 0个不合格机的选择方法为4C0。

640.png


泊松分布

泊松分布可以帮助我们预测特定事件在一段时间内发生的概率。

泊松分布的主要特征:

  • 在不重叠间隔中发生的变化数量是独立的。
  • 在足够短的时间间隔h内发生一次变化的概率大约为λh,,其中λ>0。
  • 在足够短的时间内发生两次或两次以上变化的概率本质上是零。

640.png


注意泊松是二项分布的极限形式。对于较大的n,我们有p= λ /n。

例子

问:假设某种流感疫苗产生副作用的概率为0.005。假如1000人接种,找到至多一个人患病的近似概率。

由于n=1000是一个很大的数,我们可以使用泊松近似二项分布来解决这个问题,其中λ =pn = 0.005 * 1000 =5。P(x≤1) = P(x=0)+P(x=1)

640.png


问:在某一住所接收电话是一种泊松过程,参数为每小时2次。如果某人洗了10分钟的澡,在这段时间里电话响的概率是多少?

假设每60分钟有两次电话,我们首先计算预期每10分钟电话响的次数,即:现在我们要计算在这10分钟内至少接到一次电话的概率,本质上我们要计算P(X≥1)它可以写成1 - P(X=0)

640.png


几何分布

几何分布表示在第一次成功之前,一定数量的试验将发生的概率。遵循几何分布的一个典型问题是,确定一枚抛出去的硬币在第一次出现正面之前出现反面的次数。

几何分布的主要特征:

  1. 考虑一系列独立的试验,每个试验都有两种可能的结果,成功或失败。设p是成功的概率。定义随机变量X为第一次成功的试验。
  2. 理论上,试验的次数可以永远持续下去。至少要进行一次成功试验。

640.png


例子

问:机器生产出有缺陷产品的概率是0.01。每一项都在生产时进行检查。假设这些是独立的试验,并计算必须检查至少100个项目才能找到一个有缺陷的概率。

由公式可知,P(X≥100)→P(X>99)

640.png


结论

概率分布是统计学的基础,就像数据结构是计算机科学的基础一样。在本文中,我总结了几个最常见的离散概率分布的用例。这只是概率分布的基础。

想要了解更多的概率分布知识,请查看这张无比详细的单变量分布地图!

http://www.math.wm.edu/~leemis/chart/UDR/UDR.html

目录
相关文章
|
3月前
|
存储 弹性计算 运维
阿里云服务器经济型e实例怎么样?性能如何?有用过的吗?
阿里云服务器经济型e实例怎么样?性能如何?有用过的吗?阿里云服务器ECS推出经济型e系列,经济型e实例是阿里云面向个人开发者、学生、小微企业,在中小型网站建设、开发测试、轻量级应用等场景推出的全新入门级云服务器,CPU采用Intel Xeon Platinum架构处理器
|
2月前
|
存储 编解码 缓存
购买阿里云服务器如何选择实例?根据业务场景与细分场景选择实例规格
对于很多初次购买阿里云服务器的用户来说,面对众多可选择的云服务器实例规格,往往不知道如何选择,不同实例规格适用于不同的业务场景,本文为大家汇总了不同业务场景和细分场景下应该选择的主要实例规格,以及这些实例规格的主要性能和适用场景,如果你不知道如何选择阿里云服务器的实例规格,不妨根据自己的场景参考本文所推荐的主要实例规格来选择。
购买阿里云服务器如何选择实例?根据业务场景与细分场景选择实例规格
|
2月前
|
存储 弹性计算 负载均衡
ecs选择合适的实例规格
选择阿里云ECS实例需综合考虑业务类型、工作负载、存储需求、扩展性和预算。针对计算密集型、内存密集型和通用型任务,有C6/C7、R6/R7和G5/G7系列实例。网络密集型可选网络增强型。稳定型工作负载适合非突发性能实例,波动负载可选突发性能实例。依据存储和I/O需求选择云盘类型,并确保实例支持灵活扩展。高可用架构需结合负载均衡等服务。预算是重要考量,可通过阿里云控制台和官方资源选取性价比最高的实例。
18 2
|
8月前
|
存储 弹性计算 缓存
阿里云服务器通用算力型实例规格性能、适用场景及价格参考
通用算力型云服务器阿里云推出的一款高性价比系列云服务器产品,也是目前阿里云官网活动中比较推荐用户购买的云服务器产品,目前通用算力型云服务器的活动价格略高于经济型e实例,但又比计算型c7、通用型g7等其他系列的云服务器价格要低一些,本文通过介绍通用算力型云服务器的性能、产品优势及适用场景和价格等情况,从而让大家了解通用算力型云服务器,对是否选择通用算力型云服务器做一个参考。
阿里云服务器通用算力型实例规格性能、适用场景及价格参考
|
4月前
|
存储 弹性计算 网络协议
阿里云服务器通用算力型u1实例性能介绍及活动价格参考
通用算力型u1实例是阿里云推出的高性价比云服务器实例,支持多款Intel Xeon Platinum 可扩展处理器,基准vCPU算力与5代企业级实例持平,最高vCPU算力与6代企业级实例持平,主要适用于Web应用及网站,企业办公类应用,数据分析和计算等大多数通用的对vCPU算力和性能要求不高的应用场景。本文为大家详细介绍倚天云服务器实例的主要性能和最新活动价格情况。
阿里云服务器通用算力型u1实例性能介绍及活动价格参考
|
9月前
|
存储 编解码 前端开发
阿里云服务器计算型c5、c6、c7、c8y实例四代产品对比
目前阿里云在售的云服务器中,包含了第5代、第6代、第7代和最新第八代倚天云服务器产品,有的新手用户并不清楚这四代产品之间的差别,下面以计算型c5、c6、c7、c8y实例为例,为大家展示这四代云服务器实例在规格、CPU(核)、内存(G)、计算、存储、内存以及不同配置的指标数据等方面为大家做个对比,让大家了解一下他们之间的不同,以供参考和选择。
507 1
阿里云服务器计算型c5、c6、c7、c8y实例四代产品对比
|
11月前
|
存储 机器学习/深度学习 Dragonfly
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
继推出轻量应用服务器与通用算力型u1、计算型c7、通用型g7和内存型r7实例云服务器优惠之后,阿里云服务器优惠上新品了,性价比最高的c8y、g8y、r8y云服务器7.2折,购买时长最高可选5年,c8y、g8y、r8y云服务器采用阿里自研倚天710处理器,基于最新一代CIPU和Dragonfly ARM Hypervisor ,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。下面小编来详细介绍下这几款云服务器的实例性能、指标数据及可选配置和优惠价格情况。
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
|
11月前
|
存储 弹性计算 编解码
阿里云计算型c7实例测评,看看这款计算型云服务器实例怎么样?
计算型c7实例云服务器是目前阿里云官方重点推荐的一款第七代云服务器实例,这款云服务器实例主打的是性能更优,下面小编通过实例介绍、云服务器配置、适用场景、性能提升、指标数据、最新价格这6个方面来做一个测评和介绍,看看这款性能更优云服务器到底怎么样,为什么阿里云官方活动会重点推荐这个实例规格的云服务器。
501 0
阿里云计算型c7实例测评,看看这款计算型云服务器实例怎么样?
|
12月前
|
数据采集 弹性计算 供应链
阿里云服务器三种付费类型怎么选择合适?
阿里云服务器三种付费类型怎么选择合适?阿里云服务器ECS付费类型包年包月、按量付费和抢占式实例有什么区别?包年包月先付费后使用,最低购买一个月时长,平均下来价格优惠;按量付费先使用后付费,按小时结算费用,适合短期使用,平均下来费用要比包年包月贵一些;抢占式实例和按量付费相类似,只是价格上要比按量的优惠90%,但是抢占式实例可能会被系统释放,抢占式实例适合无状态的应用。阿里云百科来详细说下阿里云服务器付费模式包年包月、按量付费和抢占式实例区别以及选择方法:
423 0
|
存储 SQL 固态存储
如何选择合适的云数据库架构与规格
NineData 联合创始人周振兴(苏普)受邀参加2023年 ACMUG 第一站西安站,发表了《云数据库架构与选型》主题演讲。
273 1
如何选择合适的云数据库架构与规格