Machine Learning-L9-贝叶斯分类器（涉及贝叶斯的全在这了）（上）

2022-11-21 132

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Machine Learning-L9-贝叶斯分类器（涉及贝叶斯的全在这了）

1. 贝叶斯定理

1763年12月23日，Thomas Bayes的遗产受赠者R. Price牧师在英国皇家学会宣读了贝叶斯的遗作《An essay towards solving a problem in the doctrine of chances》（《论机会学说中一个问题的求解》），其中给出了贝叶斯定理。

在这篇文章之前，人们已经能够计算“正向概率”，如12个白球和3个黑球在1个箱子中，随机取1个球，计算该球为白球的概率。

反过来，如果事先并不知道袋子里面黑白球的比例，随机取到5个球（4个白球，1个黑球），估计该总体中黑球与白球的比例。这个问题，就是所谓的逆向概率问题，可以看做在总体未知的情况，已知样本数据，对总体进行估计。

1.1 贝叶斯公式

根据条件概率：

可推导出贝叶斯公式：

其中，

P ( A )：事件A AA的先验概率（prior probability）

P ( A ∣ B ) ：事件B条件下的，事件A 的后验概率（posterior probability）

P ( B )：事件B 的先验概率（prior probability）

P ( B ∣ A ) ：事件A 条件下的，事件B 的后验概率（posterior probability）

条件概率可理解为：后验概率＝先验概率 × 调整因子（标准似然度）

若P ( B ∣ A ) = P ( B )或P ( A ∣ B ) = P ( A )，则P ( A B ) = P ( A ) P ( B ) ，此时事件A , B为相互独立事件，即任一事件的发生不影响另一事件的发生。

e.g1.

肺癌发病率 P ( A ) = 0.001 ；吸烟人群占比P ( B ) = 0.4 ；根据观测，肺癌病人中有80 %吸烟 P ( B ∣ A ) = 0.8 。

若某患者吸烟，则该患者肺癌的概率为：

在该例子中，贝叶斯公式将先验概率P ( A ) 转化为了后验概率P ( A ∣ B ) ，这个过程中主要利用了观察数据P ( B ∣ A )

肺癌发病率只有P ( A ) = 0.001，但是根据观察数据发现，肺癌病人的吸烟者比率 P ( B ∣ A ) = 0.8 高于整体人群的吸烟者占比P ( B ) = 0.4，因此增强了吸烟者中肺癌发病率的信念。

1.2 全概率公式

B 1 ...B n是随机试验S 的一组事件，满足以下两个条件：

称B 1 . . . B n 是样本空间S 的一个划分。

通过样本划分可以将复杂事件划分为若干不相容的简单事件B i ，利用全概率公式可求得结果事件概率P ( A )

其中，P ( B i ) 为已知的每个原因事件B i的概率，P ( A ∣ B i ))表示每个原因事件对结果事件的影响程度。

1.3 贝叶斯公式推广

P(B i∣A)用来反映引起结果事件A 发生的各种原因事件B i的可能性。

**e.g.1 ** A容器中有7个红球和3个白球，B容器中1个红球和4个白球

事件A ：从A容器里拿一个球

事件B ：从B容器里拿一个球

事件R ：拿出一个球为红球

事件W ：拿出一个球为白球

从A容器里拿球的概率P ( A ) = 1/ 2 ，从B容器里拿球的概率P ( B ) = 1/ 2

（1）随机从其中一个容器里取出一个球，该球为红球的概率：

（2）随机取出一个球为红球，该红球来自A容器的概率：

同理可得，P ( B ∣ R ) = 2/ 9

2. 频率学派 v.s. 贝叶斯学派

2.1 频率学派

从客观事件本身出发，认为事件本身具有某种客观随机性，数据样本都是在这个空间里的“某个”参数值下产生的

把参数θ视作固定且未知的常数，而样本数据D 是随机的，着眼点在样本空间通过引入了极大似然（maximum likelihood）以及置信区间（confidence interval），根据数据样本计算参数值

2.2 贝叶斯学派

从“观察者”角度出发，认为概率是主观对某个事物发生的相信程度，由于“观察者”知识不完备，需要从对客观世界的观察中得到规律更新对事件的假定

把参数θ \thetaθ视作随机变量（本身也有分布），而样本数据D DD是固定的（即实际观测到的数据集），着眼点在参数空间

通常假定参数服从一个先验分布（prior distribution），然后基于观测的数据样本（证据）来计算参数的后验分布（posterior distribution）

频率学派坚持数据说话。贝叶斯学派认为数据会有偏差，先验概率可对这些噪音做到健壮。事实证明贝叶斯学派方法更为科学，胜利的关键在于先验概率实质上也是经验统计的结果（先验信息一般源于历史的经验与资料），所谓先“验”中先于的经验就是指先于样本数据。

贝叶斯方法更符合人类认识自然的规律与日常的思考方式，即我对客观世界总有一个主观的先验判断，但是这个判断会随着对真实世界的观察而修正，从而对世界永远保持开放的态度。

文章标签：

容器

Machine Learning-L9-贝叶斯分类器（涉及贝叶斯的全在这了）（上）

1. 贝叶斯定理

1.1 贝叶斯公式

1.2 全概率公式

1.3 贝叶斯公式推广

2. 频率学派 v.s. 贝叶斯学派

2.1 频率学派

2.2 贝叶斯学派

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Machine Learning-L9-贝叶斯分类器（涉及贝叶斯的全在这了）（上）

1. 贝叶斯定理

1.1 贝叶斯公式

1.2 全概率公式

1.3 贝叶斯公式推广

2. 频率学派 v.s. 贝叶斯学派

2.1 频率学派

2.2 贝叶斯学派

热门文章

最新文章

相关课程

相关电子书

相关实验场景