开发者学堂课程【机器学习算法 :贝叶斯推断1】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/535/detail/7273
贝叶斯推断1
内容介绍
一、贝叶斯公式推断
二、先验概率与后验概率
一、贝叶斯公式推断
1. 在概率统计中,应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的方法当不能准确知悉一个事物的本质时,可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。即支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。
2. 例:
血清蛋白检验法可以检测是否患有肝癌,由于技术原因存在误差,肝癌患者检测结果呈阳性的概率为99%没有肝癌的人检测结果呈阳性的概率为50%,据调研结果当前人类患有肝癌的概率为0.04%。某人的检测结果呈阳性,请推断他患肝癌的概率。
令事件A表示患有肝癌 事件B表示检测阳性,则事件表示未患肝癌,事件表示检测阴性,有:
P(A)=0.0004,P()=0.9996,P(B|A)=099,P(B|)=0.5
检验结果呈阳性的人患肝癌的概率是要算:P(A|B)根据贝叶斯公式:
在B发生条件下,A发生的概率等于,AB同时发生的概率除以B发生的概率。分子部分用乘法公式展开,B发生概率用全概率公式展开,得到最后结果,一个人做了血清蛋白检查呈阳性并不需要多紧张,因为事实上真正患有肝癌的可能只有万分之八不到。
将P(A)患有肝癌概率称之为先验概率,因为你先做了检验,检验出结果,相当于得到信息,将得到的信息修正先验概率,得到最后概率称之为后验概率。
贝叶斯公式可以用一句话形容:How much you can trust the evidence? 多大程度上你相信你所得到的证据。
上例中所说的证据就是,做了检验结果呈阳性,通过贝叶斯公式,由先验概率得到后验概率,而得到的后验概率就表示你有多大程度去相信你的先验概率。
二、先验概率与后验概率
1.先验概率(Prior Probability)是指根据以往经验和分析得到的概率,它往往作为“由因求果”问题中的“因”出现的概率。
事件发生前的预判概率,可以基于历史数据的统计,也可以是由背景常识得到,或者个人的主管观点。一般都是单独的事件概率,如P(患病,P(购买),P(下雨)……
2.后验概率(Posterior Probability)是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的“果”。先验概率与后验概率不可分割,后验概率的计算要以先验概率为基础。事件发生后求的反向条件概率,即去追寻什么原因造成了当前的结果。
概率形式一般和条件概率相同,如P(患病|阳性),P(购买|中老年),P(下雨|六月).....
当根据经验及有关材料推测出主观概率后,对其是否准确没有充分把握时,可采用概率论中的贝叶斯公式
进行修正,修正前的概率称为先验概率,修正后的概率称为后验概率,利用后验概率再进行风险分析。