联合概率 边缘概率 条件概率 贝叶斯定理

简介: 联合概率 边缘概率 条件概率 贝叶斯定理

概率论

本文是阅读笔记,书中对联合概率、边缘概率、条件概率与贝叶斯定理的介绍,言简意赅,很容易理解,摘录过来,方便大家查阅。

考虑两个随机变量,X,取值为{xi},其中i = 1, . . . , M,和Y ,取值为{yj},其中j = 1, . . . , L。在这个例⼦中,我们取M = 5和L = 3。如果我们考虑这些变量的总计N个实例,那么我们将X = xi且Y = yj的实例的数量记作nij,它是对应的单元格中点的数量。列i中的点的数量,对应于X = xi,被记作ci,⾏j中的点的数量,对应于Y = yj,被记作rj 。具体如下图。


联合概率

X取值xi且Y 取值yj的概率被记作p(X = xi , Y = yj ),被称为X = xi和Y = yj的联合概率(joint probability)。它的计算⽅法为落在单元格i, j的点的数量与点的总数的⽐值,即:


边缘概率

边缘概率也是概率的加和规则(sum rule)这 ⾥ 我 们 隐 式 地 考 虑 极 限N → ∞。 类 似 地,X取 值xi(与Y 取 值 ⽆ 关) 的 概 率 被 记作p(X = xi),计算⽅法为落在列i上的点的数量与点的总数的⽐值,即:


第i列上的实例总数就是这列的所有单元格中实例的数量之和,我们有 ,因此根据公式(1)和公式(2),我们有:


条件概率

如 果 我 们 只 考 虑 那 些X = xi的 实 例, 那 么 这 些 实 例 中Y = yj的 实 例 所 占 的 ⽐ 例 被 写 成p(Y = yj | X = xi),被称为给定X = xi的Y = yj的条件概率(conditional probability)。它的计算⽅式为:计算落在单元格i, j的点的数量列i的点的数量的⽐值,即:


加和规则与乘积规则

两个变量X和Y 上的概率分布的⼀个例⼦。X可以取9个可能的值,⽽Y 可以去2个可能的值。左上图给出了从这两个变量的联合概率分布中抽取的60个样本点。剩下的图给出了估计边缘概率分布p(X)和p(Y )的直⽅图,以及条件概率分布p(X | Y = 1)的直⽅图,这个条件概率分布对应于左上图的第二行。


贝叶斯定理

根据乘积规则,以及对称性p(X, Y ) = p(Y, X),我们⽴即得到了下⾯的两个条件概率之间的关系:

相关文章
|
Python
使用 Pandas 库时,如何处理数据的重复值?
在使用Pandas处理数据重复值时,需要根据具体的数据特点和分析需求,选择合适的方法来确保数据的准确性和唯一性。
904 64
|
机器学习/深度学习 索引 Windows
OFDM原理及MATLAB仿真
OFDM原理及MATLAB仿真
1063 2
|
机器学习/深度学习 PyTorch 算法框架/工具
【PyTorch实战演练】使用Cifar10数据集训练LeNet5网络并实现图像分类(附代码)
【PyTorch实战演练】使用Cifar10数据集训练LeNet5网络并实现图像分类(附代码)
818 0
|
测试技术 开发工具 文件存储
Git Stash
【8月更文挑战第27天】
491 6
|
SQL 存储 Java
实时数仓 Hologres操作报错合集之在尝试访问DataHub时,报错连接超时,该怎么处理
在使用阿里云实时数仓Hologres时,可能会遇到不同类型的错误。例如:1.内存超限错误、2.字符串缓冲区扩大错误、3.分区导入错误、4.外部表访问错误、5.服务未开通或权限问题、6.数据类型范围错误,下面是一些常见错误案例及可能的原因与解决策略的概览。
|
存储 数据挖掘 索引
Pandas数据结构:Series与DataFrame
本文介绍了 Python 的 Pandas 库中两种主要数据结构 `Series` 和 ``DataFrame`,从基础概念入手,详细讲解了它们的创建、常见问题及解决方案,包括数据缺失处理、数据类型转换、重复数据删除、数据筛选、排序、聚合和合并等操作。同时,还提供了常见报错及解决方法,帮助读者更好地理解和使用 Pandas 进行数据分析。
851 11
pycharm使用Anaconda中的虚拟环境【我的入门困惑二】
pycharm使用Anaconda中的虚拟环境【我的入门困惑二】
|
物联网 5G 数据处理
|
编解码 安全 计算机视觉
FFMPEG常用命令 音视频合并
FFMPEG常用命令 音视频合并
767 2
|
数据可视化 API 算法框架/工具
Python用稀疏、高斯随机投影和主成分分析PCA对MNIST手写数字数据进行降维可视化
Python用稀疏、高斯随机投影和主成分分析PCA对MNIST手写数字数据进行降维可视化