【贝叶斯分析】计算机科学专业博士作业一

简介: 本文通过多个案例,详细解释了贝叶斯分析在不同情境下的应用,包括跨种族夫妇的有罪概率、患X病的风险评估、犯罪现场的嫌疑人推断以及XOR运算的概率计算,展示了如何利用贝叶斯定理进行推理和决策。

1、 1964 年,一对跨种族夫妇在洛杉矶被判抢劫罪,主要是因为他们的个人资料符合极不可能的情况,而这一资料与目击者的报告相符。据目击者所述,这两名劫匪是:
男人留着小胡子 、男人是黑人 、女人绑着马尾 、女人是金发
已知信息如下:
F1:P(男人留着小胡子 | 有罪) = 1/4
F2:P(男人是黑人且有胡子 | 有罪) = 1/10
F3:P(女人绑着马尾 | 有罪) = 1/10
F4:P(女人是金发 | 有罪) = 1/3
F5:P(跨种族夫妇 | 有罪) = 1/1000
F6:P(驾驶黄色汽车 | 有罪) = 1/10
这对夫妇是跨种族的 驾驶一辆黄色汽车 假设洛杉矶夫妇数目有1625000对。
那这对夫妇有罪概率最可能是哪个?
A.11999999/12000000 B.2999/3000 C.0.002

由于F1与F2是包含关系,就不考虑F1特征;题目中已经说了是跨种族的夫妇抢劫案了,属于冗余信息,不考虑F5。
根据贝叶斯定理:
$ P(有罪 | F2,F3,F2,F6) = \frac{P(F2| 有罪) * P(F3| 有罪) *P(F4| 有罪) * P(F6| 有罪) * P(有罪) }{ P(F2,F3,F4,F6)}$
现在,我们将逐步进行计算:

  1. 计算 P(F2,F3,F4,F6): 由于这对夫妇是跨种族的且驾驶黄色汽车并符合这些特征的,我们可以假设两两事件是独立的。因此,我们可以使用条件概率的乘法规则计算它们的联合概率:
    P(F2,F3,F4,F6) = P(F2) * P(3)P(F4) * P(6)= (1/10) * (1/10) (1/3)* (1/10) = 1/1000
  2. 计算 P(有罪): 根据题目中的信息,我们没有提供准确的有罪概率,但我们可以利用假设的洛杉矶夫妇数目来近似估计。如果洛杉矶夫妇数目有1625000对,并且他们中只有一个是有罪的,那么有罪概率可以近似为: P(有罪) = 1/1625000
  3. 最后,我们可以将上述结果代入贝叶斯定理的公式:
    $ P(有罪 | F2,F3,F4,F6) = \frac{1/1625000}{1/1000} \approx 0.00184 $
    综上所述,这对夫妇有罪的概率最可能是1/1625。因此,答案接近C. 0.002

2、医生发现,患有X病的人几乎都吃过汉堡𝑝(𝐻𝑎𝑚|𝑋)=0.9,而患上X病的概率很低𝑝(𝑋)=1/100000。 假设有一半人吃过汉堡,那吃过汉堡的人患X病的概率最可能为?
A.1.8*10^(-5) B.0.002 C.0.9

我们需要求的是在已知患有X病的人几乎都吃过汉堡和患上X病的概率很低的情况下,吃过汉堡的人患X病的概率。根据贝叶斯定理,我们可以得到:
$ P(X|Ham)=\frac{P(Ham|X)P(X)}{P(Ham)} $
其中,P(X)表示患上X病的概率,P(Ham|X)表示在已知患有X病的情况下吃过汉堡的概率,P(Ham)表示吃过汉堡的概率。
由题目可知:P(X)=1/100000,P(Ham|X)=0.9,P(Ham)=0.5
将这些数据代入公式中:
\begin{aligned} &P(X|Ham)=\frac{P(Ham|X)P(X)}{P(Ham)} \\ &=\frac{0.9\times \frac{1}{100000}}{0.5} \\ &=0.0018 \\ &=1.8\times 10^{-5} \end{aligned}
因此,答案为A. 1.8*10^(-5)。

医生发现,患有X病的人几乎都吃过汉堡𝑝(𝐻𝑎𝑚|𝑋)=0.9,而患上X病的概率很低𝑝(𝑋)=1/100000。 假设很少人吃过汉堡,𝑝(𝐻𝑎𝑚)=0.001。则吃过汉堡的人患X病的概率最可能为?
A.9/1000 B.5/1000 C.1/1000

根据贝叶斯定理:
$ P(X|Hamburgers) = \frac{P(Hamburgers|X)P(X)}{P(Hamburgers)} $
其中,P(X) 表示患病的先验概率,即在不考虑其他因素的情况下,一个人患上 X 病的可能性;P(Hamburgers) 表示吃汉堡的先验概率;P(Hamburgers|X) 表示在已知一个人患有 X 病的情况下,他吃过汉堡的条件概率;P(X|Hamburgers) 表示在已知一个人吃过汉堡的情况下,他患有 X 病的后验概率。
将题目中给出的数据带入上式,得到:
$ P(X|Hamburgers) = \frac{0.9\times 0.00001}{0.001} = 0.009 $
因此,答案是 A. 9/1000。

3、警察抵达犯罪现场。受害者死在房间里,旁边还有一把可能是凶器的刀。管家(B)和女仆(M)是检查员的主要嫌疑人,检查员对管家是凶手的先验信念为 0.6,对女仆是凶手的先验信念为 0.2。这些信念在 p(B, M) = p(B)p(M) 的意义上是独立的。 (有可能管家和女仆都谋杀了受害者,也有可能两者都没有)。检查员先前的犯罪知识可以用数学公式表示如下: 𝒅𝒐𝒎(𝑩)=𝒅𝒐𝒎(𝑴)= {𝒎𝒖𝒓𝒅𝒆𝒓𝒆𝒓, 𝒏𝒐𝒕 𝒎𝒖𝒓𝒅𝒆𝒓𝒆𝒓} 𝒅𝒐𝒎(𝑲) = {𝒌𝒏𝒊𝒇𝒆 𝒖𝒔𝒆𝒅, 𝒌𝒏𝒊𝒇𝒆 𝒏𝒐𝒕 𝒖𝒔𝒆𝒅}
p(knife used|B = not murderer, M = not murderer) = 0.3
p(knife used|B = not murderer, M = murderer) = 0.2
p(knife used|B = murderer, M = not murderer) = 0.6
p(knife used|B = murderer, M = murderer) = 0.1 另外
𝑝(𝐾, 𝐵, 𝑀) = 𝑝(𝐾|𝐵, 𝑀)𝑝(𝐵)𝑝(𝑀)。 假设刀是凶器,那么管家是凶手的概率最可能为? (凶手可能都不是)。 A.0.6 B.0.73 C.0.2

首先说明一个公式P(K,B,M) = P(K|B,M)P(B)P(M)
则管家式凶手的概率计算公式为
$ p = \frac{P(K,B,M)+P(K,B,\neg M)}{P(\Delta)} \\ =\frac{P(K,B,M)+P(K,B,\neg M)}{P(K,B,M)+P(K,B,\neg M)+P(K,\neg B,M)+P(K,\neg B,\neg M)} = \frac{P(K|B,M)P(B)P(M)+P(K|B,\neg M)P(B)P(\neg M)}{P(K|B,M)P(B)P(M)+P(K|B,\neg M)P(B)P(\neg M)+P(K|\neg B,M)P(\neg B)P(M)+P(K|\neg B,\neg M)P(\neg B)P(\neg M)} \\ = \frac{0.1 \times 0.6 \times 0.2+0.6 \times 0.6 \times 0.8}{0.1 \times 0.6 \times 0.2+0.6 \times 0.6 \times 0.8 +0.2 \times 0.4 \times0.2 + 0.3 \times 0.4 \times 0.8} \\ = \frac{0.3}{0.412} \approx 0.73 $
因此,答案是B 0.73

4、XOR运算如下表格所示:

A B P(C=1 A,B)
0 0 0.1
0 1 0.99
1 0 0.8
1 1 0.25

C的输出结果与A和B有关,且 ● A⫫𝑩 ● 𝑝(𝐴=1)=0.65 ● 𝑝(𝐵=1)=0.77 𝑝(𝐴=1|𝐶=0)最可能为:
A.0.12 B.0.84 C.0.56

根据题目已知:
P(A=1) = 0.65,P(B=1)=0.77
则P(A=0)= 0.35,P(B=0)=0.23
根据贝叶斯定理,则有:
$ P(A=1|C=0) =\frac{P(C=0|A=1) \times P(A=1)}{P(C=0)} $
其中
$ P(C=0|A=1) = 1 - P(C=1|A=1) \\ = 1 - P(C=1|A=1,B=0)P(B=0)+P(C=1|A=1,B=1)P(B=1) \\ =1-(0.8 \times 0.23+0.25 \times 0.77)\\ \approx 0.6235 $
根据全概率公式
$ P(C=0) =1-P(C=1) P(C=1)= P(C=1|A=0,B=0) \times P(A=0) \times P(B=0) + P(C=1|A=0,B=1) \times P(A=0) \times P(B=1) + P(C=1|A=1,B=0) \times P(A=1) \times P(B=0) + P(C=1|A=1,B=1) \times P(A=1) \times P(B=1) = (0.1 \times 0.35 \times 0.23)+(0.99 \times 0.35 \times0.77)+(0.8 \times 0.65 \times0.23)+(0.25 \times 0.65 \times 0.77)\\ \approx 0.47002 $
带入以上结果得到
$ P(A = 1|C=0 )= \frac{P(C=0|A=1)}{P(C=0)} \\ = \frac{0.6235 \times 0.65}{0.48042} \\ \approx 0.84358 $

另外一种求解方法

根据题目含义
$ P(A=1,C=0) = \frac{P(A=1,C=0)}{P(A=1,C=0)+P(A=0,C=0)} $
其中
$ P(A=1,C=0)=\sum_B{P(A=1,B,C=0)} \\ =\sum_B{P(C=0|A=1,B)P(B)} \\ = P(A=1)(P(C=0|A=1,B=0)P(B=0)+P(C=0|A=1,B=1)P(B=1))\\=0.65 \times (0.2 \times 0.23 +0.75 \times 0.77) \\ = 0.405275 $

$ P(A=0,C=0)=\sum_B{P(A=0,B,C=0)} \\ =\sum_B{P(C=0|A=0,B)P(B)} \\ = P(A=0)(P(C=0|A=0,B=0)P(B=0)+P(C=0|A=0,B=1)P(B=1))\\=0.35 \times (0.9 \times 0.23 +0.01 \times 0.77) \\ = 0.075145 $
带入以上公式
得到
$ P(A=1,C=0) = \frac{P(A=1,C=0)}{P(A=1,C=0)+P(A=0,C=0)} = \frac{0.405275}{0.405275+0.075145} \approx 0.8436 $

答案,接近B 0.84

5、 一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9。 问题是:在狗叫的时候发生入侵的概率最可能为?
A.0.00058 B.0.9 C.0.0058

我们可以使用贝叶斯定理来计算在狗叫的时候发生入侵的概率。假设事件A表示入侵事件发生,事件B表示狗叫事件发生。
根据题目给出的信息,我们有以下条件概率:
P(B|A) = 0.9,即在入侵事件发生时狗叫的概率为0.9。
P(B) = 3/7
P(A) = 2/(20*365)
我们需要计算的是在狗叫的情况下发生入侵的概率:P(A|B)。
根据贝叶斯定理:
P(A|B) = P(B|A) * P(A) / P(B)
$ = \frac{0.9*2/(20*365)}{3/7} $
= 0.00058

目录
相关文章
|
4天前
|
人工智能 测试技术
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年
著名数学家陶哲轩联合60多位数学家推出FrontierMath基准测试,评估AI在高级数学推理方面的能力。该测试涵盖数论、实分析等多领域,采用新问题与自动化验证,结果显示最先进AI通过率仅2%。尽管存在争议,这一基准为AI数学能力发展提供了明确目标和评估工具,推动AI逐步接近人类数学家水平。
51 37
|
5月前
【贝叶斯分析】计算机科学专业博士作业二
本文通过多个实例详细解释了如何使用贝叶斯定理和贝叶斯网络来求解条件概率和期望效用等问题。
44 2
|
5月前
|
机器学习/深度学习 算法 PyTorch
【模式识别】计算机科学博士课程作业解析
课程作业的解析,涵盖了最小风险贝叶斯决策、最小错误率贝叶斯决策、Python编程实现的机器学习算法,包括KNN、SVM和卷积神经网络在特定数据集上的应用与评估。
43 1
|
5月前
|
数据可视化 数据挖掘 数据库连接
【数据挖掘】2022年2023届秋招爱玩特智能量化研究员岗 笔试题
本文提供了2022年爱玩特智能量化研究员岗位的笔试题目及Python代码实现,涉及数据库连接、数据可视化、投资回报率计算、累计回报率、描述性统计分析以及简单线性回归等任务。
49 2
|
机器学习/深度学习 人工智能
大模型铺天盖地出现后,计算机科学终成「自然科学」
大模型铺天盖地出现后,计算机科学终成「自然科学」
|
机器学习/深度学习 人工智能 自然语言处理
北大、阿里妈妈成立联合实验室,产学大牛合体,图模型、博弈论都安排上了!
北大、阿里妈妈成立联合实验室,产学大牛合体,图模型、博弈论都安排上了!
105 0
|
机器学习/深度学习 存储 数据采集
学术加油站|机器学习应用在数据库调优领域的前沿工作解读
学术加油站|机器学习应用在数据库调优领域的前沿工作解读
284 0
学术加油站|机器学习应用在数据库调优领域的前沿工作解读
|
量子技术 数据安全/隐私保护
【八年苦读】伯克利研究生解决量子计算验证问题
来自加州大学伯克利分校的研究生Urmila Mahadev解决了量子计算中的验证问题。她将经典密码学与量子领域进行结合,解决了“量子计算中最根本的问题之一。”即,如果你让一台量子计算机为你执行一个计算,那么你如何确定它确实执行了你的指令,甚至如何得知它是否做了与量子相关的事情。
6603 0
|
安全 算法 大数据
哪个专业最有“钱途”?计算机科学蝉联桂冠
又到一年毕业季,一边是各地高考志愿填报工作紧张进行,一边是应届大学毕业生进入就业市场。专业和薪酬成为这段时间很多人关心的话题。那么,近年来,哪些专业最有“钱途”?哪些专业市场需求量大?应届大学毕业生的预期薪酬和实际薪酬差距有多大?南都大数据研究院联合BOSS直聘研究院发布《2018应届生就业市场报告》,将进行全方位解读。
2219 0