朴素贝叶斯法(一)——贝叶斯定理

简介:

最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian ModelNBC)。

贝叶斯定理250多年前发明的算法,在信息领域内有着无与伦比的地位。贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素贝叶斯算法(Naive Bayesian) 是其中应用最为广泛的分类算法之一。

 

贝叶斯定理

描述

贝叶斯定理是关于随机事件AB条件概率的一则定理。

clip_image001

在贝叶斯定理中,每个名词都有约定俗成的名称:

按这些术语,Bayes定理可表述为:

后验概率 = (相似度*先验概率) / 标准化常量

P(B|A)称为“可能性函数,这是个调整因子,使得预估计概率更接近真实概率。

所以,条件概率可以理解为式子:

       后验概率 = 先验概率 调整因子

这就是贝叶斯推断的含义:我们先预测一个先验概率,然后加入实验结果,看这个实验到底是增强还是削弱了先验概率,由此得到更加真实的后验概率

在这里,如果可能性函数”P(B|A)>1,意味着先验概率被增强,事件A发生的可能性增大;如果可能性函数”P(B|A)=1,意味着事件B无助于判断事件A的可能性;如果可能性函数”P(B|A)<1,意味着先验概率被减弱,事件A发生的可能性变小。

推导

根据条件概率的定义。在事件B发生的条件下事件A发生的概率是

clip_image002

同样地,在事件A发生的条件下事件B发生的概率

clip_image003

整理与合并这两个方程式,我们可以找到

clip_image004

这个引理有时称作概率乘法规则。上式两边同除以P(B),若P(B)是非零的,我们可以得到贝叶斯定理:

clip_image005

贝叶斯定理通常可以再写成下面的形式:

clip_image006

其中ACA补集。故上式亦可写成:

clip_image007

在更一般化的情况,假设{Ai}是事件集合里的部分集合,对于任意的Ai,贝叶斯定理可用下式表示:

clip_image008

案例

clip_image009clip_image010clip_image011clip_image012clip_image013clip_image014                   30                                                                                                                                               20     

clip_image015clip_image016                   10                                                                                                                                               20

                                                                                                                                                       

 

暗箱操作,现在从其中一个箱子中得到一个绿球,问是从黑箱中取得的概率是?

分析:假定“从黑箱中取球为事件A,“从红箱中取球为事件B,“取到绿球为事件M.

则问题为求P(A|M)

由贝叶斯定理得:P(A|M) = P(A) * P(M|A) / P(M)

= P(A) * P(M|A) /[ P(M|A)*P(A) + P(M|B) *P(B)]

其中,P(A)=P(B) = 1/2, P(M|A) = 3/4, P(M|B) = 1/2

结果为0.6,表明,来自黑箱的概率为0.6。也就是得到绿球后,事件A(取自于黑箱)的可能性增强了。

 




本文转自jihite博客园博客,原文链接:http://www.cnblogs.com/kaituorensheng/p/3372145.html,如需转载请自行联系原作者

相关文章
|
11月前
|
自然语言处理 数据中心
Scaling LLM Test-Time Compute Optimally: 一种更有效的方法
【10月更文挑战第14天】本文探讨了大型语言模型(LLMs)在测试时通过增加计算资源来提升性能的可能性。研究发现,通过优化测试时计算的分配,特别是采用基于过程的验证器搜索和自适应更新响应分布的方法,LLM可以显著提高对复杂问题的应对能力,甚至在某些情况下超越更大规模的模型。论文提出了“计算最优”策略,旨在根据问题难度自适应调整计算资源,以最大化性能提升。未来工作将聚焦于增强测试时计算缩放、快速评估问题难度及实现自我改进循环。
465 6
|
设计模式 存储 安全
详解单例模式及其在Sping中的最优实践
在程序中,每new() 一个对象,就会有一个对象实例生成。有时候在程序中,需要有一个在完整运行状态下只需要生成一个的实例,我们把这种实例称为单例。 抽象到设计模式中,这种只生成一个实例的模式就是单例模式(Singleton)。
|
6天前
|
人工智能 运维 安全
|
3天前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
B站开源IndexTTS2,用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。
499 14
|
11天前
|
人工智能 JavaScript 测试技术
Qwen3-Coder入门教程|10分钟搞定安装配置
Qwen3-Coder 挑战赛简介:无论你是编程小白还是办公达人,都能通过本教程快速上手 Qwen-Code CLI,利用 AI 轻松实现代码编写、文档处理等任务。内容涵盖 API 配置、CLI 安装及多种实用案例,助你提升效率,体验智能编码的乐趣。
868 109
|
4天前
|
人工智能 测试技术 API
智能体(AI Agent)搭建全攻略:从概念到实践的终极指南
在人工智能浪潮中,智能体(AI Agent)正成为变革性技术。它们具备自主决策、环境感知、任务执行等能力,广泛应用于日常任务与商业流程。本文详解智能体概念、架构及七步搭建指南,助你打造专属智能体,迎接智能自动化新时代。