概率图模型在真实世界中的应用

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 概率图模型有许多不同的实际应用。 为了激起大家对概率图模型的兴趣,也为了让大家能够对概率图模型有感性的认知,本章会分享概率图模型的诸多实际应用案例。

概率图模型在真实世界中的应用

概率图模型有许多不同的实际应用。 为了激起大家对概率图模型的兴趣,也为了让大家能够对概率图模型有感性的认知,本章我会分享概率图模型的诸多实际应用案例。

causal_ai.jpeg

图像中的概率模型

考虑图像上的一个分布 $p(\mathbf{x})$,其中 $\mathbf{x}$ 是以像素向量表示的图像,它将高概率赋予看起来真实的图像,而将低概率分配给不真实的。有了这样一个模型,我们可以完成大量有趣的任务。

图像生成

Radfold 等人训练了一个概率模型 $p(\mathbf{x})$ 将高概率赋予看起来像卧室的图片。为了实现这一点,他们在如下图所示的卧室图像数据集上训练了他们的模型:

训练数据集

bedroominpainting1.png

当我们有了卧室的概率模型,我们就可以通过从分布中采样来生成新的真实卧室图像。具体来说,新的采样图像 $\hat{\mathbf{x}} \sim p(\mathbf{x})$ 是直接从我们的模型 $p(\mathbf{x})$ 中创建的,现在可以生成类似于我们训练它使用的卧室图像的数据。

此外,生成模型之所以强大的原因之一在于,它们的参数比它们训练的数据量少得多,因此,模型必须有效地提取训练数据的本质,才能生成新样本。我们看到,我们的卧室概率模型很好地捕捉了数据的本质,因此可以生成高度逼真的图像,其中一些示例如下:

生成的数据

bedroominpainting2.png

同样,我们可以学习人脸模型。

progressiveGAN.png

和卧室里的照片一样,这些脸部照片不是来自与真实的人,而是完全合成出来的。

同样的方法也可以用于任何其他事物。

pnpgan.png

注意,图像不是完美的,可能需要细化;然而,采样生成的图像与人们期望的非常相似。

图像修复

用前面的脸部模型 $p(\mathbf{x})$,我们还可以“填充”图像的其余部分。例如,给定模型 $p(\mathbf{x})$ 和已有图片的片段(比如照片的一部分),我们可以从 $p(\textsf{图片} \mid \textsf{片段})$ 中采样,并生成完整图片的可能样貌:

inpainting3.png

请注意概率模型捕捉不确定性的重要性:可以有多种方法来完成图像!

图像降噪

类似地,给定一个被噪声破坏的图像(例如,一张旧照片),我们可以尝试基于图像外观的概率模型来恢复它。具体来说,我们需要生成一个图模型 $p(\textsf{原图} \mid \textsf{噪声图})$ ,该模型能够很好地建模后验分布。然后,通过观察噪声图像,我们可以采样或使用精确推理来预测原始图像。

语言模型

了解概率分布也可以帮助我们建模自然语言语句。在这种情况下,我们希望在单词或字符序列 $x$ 上构建一个概率分布 $p(x)$,为正确的(英语)句子分配高概率。可以从各种来源(如维基百科文章)了解此分布。

生成

假设我们从维基百科文章中构建了一个单词序列的分布。然后,我们可以从这个分布中采样,生成新的类似维基百科的文章,如下所示[^1] :

Naturalism and decision for the majority of Arab countries' capitalide was grounded
by the Irish language by [[John Clair]], [[An Imperial Japanese Revolt]], associated
with Guangzham's sovereignty. His generals were the powerful ruler of the Portugal
in the [[Protestant Immineners]], which could be said to be directly in Cantonese
Communication, which followed a ceremony and set inspired prison, training. The
emperor travelled back to [[Antioch, Perth, October 25|21]] to note, the Kingdom
of Costa Rica, unsuccessful fashioned the [[Thrales]], [[Cynth's Dajoard]], known
in western [[Scotland]], near Italy to the conquest of India with the conflict.
Copyright was the succession of independence in the slop of Syrian influence that
was a famous German movement based on a more popular servicious, non-doctrinal
and sexual power post. Many governments recognize the military housing of the
[[Civil Liberalization and Infantry Resolution 265 National Party in Hungary]],
that is sympathetic to be to the [[Punjab Resolution]]
(PJS)[http://www.humah.yahoo.com/guardian.
cfm/7754800786d17551963s89.htm Official economics Adjoint for the Nazism, Montgomery
was swear to advance to the resources for those Socialism's rule,
was starting to signing a major tripad of aid exile.]]

翻译

假设我们收集了一组用英文和中文转录的训练段落。我们可以建立一个概率模型$p(y \mid x)$,根据相应的汉语句子 $x$ 生成英语句子 $y$;这是机器翻译的一个例子。

nmt-model-fast.gif

音频模型

我们还可以将概率图模型用于音频应用中。假设我们在音频信号上构造一个概率分布 $p(x)$,将高概率分配给听起来像人类语音的信号。

提升采样或超分辨率

给定低分辨率版本的音频信号,我们可以尝试提升其分辨率。我们可以将这个问题表述为:鉴于我们的语音概率分布 $p(x)$ “知道”典型的人类语音听起来是什么样子的,以及音频信号的一些观测值,我们的目标是计算中间时间点的信号值。

在下图中,给定观察到的音频信号(蓝色的)和音频的一些基本模型,我们旨在通过预测中间信号(白色的)来重建原始信号(虚线)的高保真版本。

audioSuperresolution.png

我们可以通过对 $p(\textbf{I} \mid \textbf{O})$ 进行采样或推理来解决这个问题,其中 $\textbf{I}$ 是我们想要预测的中间信号,$\textbf{O}$ 是观察到的低分辨率音频信号。

音频信号超分辨率demo

语音合成

正如我们在图像处理中所做的那样,我们还可以对模型进行采样并生成(合成)语音信号。

语音合成demo

语音识别

给定语音信号和语言(文本)的(联合)模型,我们可以尝试从音频信号中推断语言内容。

speech.png

科学研究

纠错码

在非理论世界中,概率模型通常用于建模通信信道(例如,以太网或Wifi)。例如,如果你通过信道发送消息,由于噪声,可能会在另一端收到不同的消息。基于图模型的纠错码及技术常用于检测和纠正通信错误。

Picture1.png

计算生物学

图模型也广泛应用于计算生物学。例如,给定DNA序列如何随时间演化的模型,可以从给定物种的DNA序列重建系统发育树。

philo.png

生态学

图模型常用于研究随空间和时间演变的现象,捕捉空间和时间相关性。例如,可以用来研究鸟类迁徙。

bird_new.gif

经济学

图模型可用于建模利息数量的空间分布(例如,基于资产或支出的财富度量)。

uganda.png.jpg

最后两个应用即所谓的时空模型。它们依赖于跨时间和空间收集的数据。

医疗健康

医疗诊断

概率图模型可以帮助医生诊断疾病和预测不良反应。例如,1998年,犹他州盐湖城的LDS医院开发了诊断肺炎的贝叶斯网络。他们的模型能够以高灵敏度(0.95)和特异性(0.965)区分肺炎患者和其他疾病患者,并在临床上使用多年。他们的网络模型概述如下:

diagnostic_bayes_net.PNG

[^1]: 来自 The Unreasonable Effectiveness of Recurrent Neural Networks

目录
相关文章
|
6月前
|
人工智能 自然语言处理
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
【6月更文挑战第24天】论文《Language Models as Text-Based World Simulators?》由多所名校和机构合作完成,探讨大型语言模型(LLMs)如GPT-4是否能胜任世界模拟器角色。新基准BYTE-SIZED32-State-Prediction用于评估其模拟文本游戏状态转换的能力。结果显示,GPT-4在某些任务上接近人类表现,但在算术、常识推理和环境动态模拟上仍有不足,表明LLMs尚无法成为可靠的全功能世界模拟器。研究指出了LLMs改进和未来研究的潜力方向。[[1](https://arxiv.org/pdf/2403.19655)]
56 1
|
7月前
|
机器学习/深度学习 开发框架 算法
非线性混合效应 NLME模型对抗哮喘药物茶碱动力学研究
非线性混合效应 NLME模型对抗哮喘药物茶碱动力学研究
|
机器学习/深度学习 算法
基于文化算法优化的神经网络预测研究(Matlab代码实现)
基于文化算法优化的神经网络预测研究(Matlab代码实现)
|
机器学习/深度学习 存储 人工智能
什么是概率图模型?
概率图模型是机器学习的一个分支,重点研究如何利用概率分布描述真实世界并对其做出有价值的预测。本教程对图模型的讨论将分为三个主要部分:表示(如何描述模型)、推理(如何向模型提问)和学习(如何用现实数据训练模型)。这三个主题相辅相成,从零开始一步一步带你深入理解最前沿的因果AI理论。
215 0
什么是概率图模型?
|
机器学习/深度学习 自然语言处理 算法
预测蛋白质间相互作用更准确、更细致,一个基于基因本体术语集的Transformer框架
预测蛋白质间相互作用更准确、更细致,一个基于基因本体术语集的Transformer框架
125 0
预测蛋白质间相互作用更准确、更细致,一个基于基因本体术语集的Transformer框架
|
机器学习/深度学习 自然语言处理 数据安全/隐私保护
一个基于Transformer的深度学习架构,在基因调控中组蛋白代码的定量破译方面性能超群
一个基于Transformer的深度学习架构,在基因调控中组蛋白代码的定量破译方面性能超群
146 0
|
机器学习/深度学习 算法 量子技术
机器学习解决核磁共振谱中「谁是谁」的问题,可直接从晶体结构预测化学位移
机器学习解决核磁共振谱中「谁是谁」的问题,可直接从晶体结构预测化学位移
104 0
|
机器学习/深度学习 传感器 算法
基于文化算法优化的神经网络预测问题研究附matlab代码
基于文化算法优化的神经网络预测问题研究附matlab代码
|
机器学习/深度学习 算法 知识图谱
iScience | 大规模表征学习寻找分子间相互作用
iScience | 大规模表征学习寻找分子间相互作用
143 0
iScience | 大规模表征学习寻找分子间相互作用
|
机器学习/深度学习 算法 Go
哈佛CASTER | 基于化学子结构表征预测药物相互作用
哈佛CASTER | 基于化学子结构表征预测药物相互作用
212 0
哈佛CASTER | 基于化学子结构表征预测药物相互作用

热门文章

最新文章