备案控制台

开发者社区人工智能文章正文

变分推断|机器学习推导系列（十四）

2022-06-07 219

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 变分推断|机器学习推导系列（十四）

一、概述

对于概率模型来说，如果从频率派角度来看就会是一个优化问题，从贝叶斯角度来看就会是一个积分问题。首先从频率派角度角度来看，我们假设模型的最优参数是一个确定的常数。回想之前的线性回归，我们使用最小二乘法来定义损失函数；在支持向量机中最终转化为一个约束优化问题；在EM算法中我们迭代求解模型的参数。这些算法的共同点是从参数空间中寻找最优的参数，因此最终都会演化成一个优化问题。

那么为什么从贝叶斯角度来看就会是一个积分问题呢？现在以贝叶斯的角度来看待问

题，模型的参数此时并非确定的常数，而是服从一个分布。如果已有多个样本数据记作 MTH{SMP6MM1@U7DLPLV1NRO.png ，对于新的样本 Z`GB8)3PRUDV5B_TTJA`1TW.png ，需要得到：

2QNEC9U@Q](]@%(R2AS)8X9.png

如果新样本和数据集独立，那么这个推断问题就是求概率分布依参数后验分布的期望。推断问题的核心是参数后验分布的求解，推断分为：

精确推断

近似推断-参数空间无法精确求解：

①确定性近似-如变分推断

②随机近似-如 MCMC，MH，Gibbs

二、公式导出

有以下数据：

Y51]N~4XQ%8DO12Q8]YGZ{G.png

7HD)JZQL7DQCCCIVJ7$CFN4.png

对于②：

E`_]PDFL4DMG4V]JVN@F(NT.png

三、回顾EM算法

$]9KF((J38M7LE_GERF0W{{H.png$

~VJN@E6L7BX{({@4$0Z%8N0.png

~VJN@E6L7BX{({@4$0Z%8N0.png

基于平均场假设的变分推断存在⼀些问题：

①假设太强，⾮常复杂的情况下，假设不适⽤；

②期望中的积分，可能⽆法计算。

四、随机梯度变分推断（SGVI）

直接求导数的方法

A}SH$@FL(U[1~DIT_LFC4`B.png

OS0O%3O(7B1LKNJ]_8WK9PL.png

这个期望可以通过蒙特卡洛采样来近似，从⽽得到梯度，然后利⽤梯度上升的⽅法来得到参数：

W0VT`6OJ699GGNH8V[XA()C.png

I`M6GH`2FUZ5XF12XX7HI8L.png

重参数化技巧

$1P}]IC88_@YL0CQV{FESDOP.png$

对最终这个中括号里的式子进行蒙特卡洛采样，然后计算期望，得到梯度。这里的采样就是从 XOZT5W7PVL)$%I7Y@N8V708.png 中进行采样了。

SGVI的迭代过程为：

$AUF}}BQZ@JQ4A@4DC{FYZ_C.png$

蒙特卡洛采样的方法会在后面的文章中介绍。

文章标签：

机器学习/深度学习

算法

关键词：

机器学习平台 PAI推断

机器学习平台 PAI推导

推断机器学习平台 PAI推导

酷酷的群

目录

相关文章

真的很搞笑

|

7月前

|

机器学习/深度学习人工智能 JSON

人工智能平台PAI问题之推断报错如何解决

人工智能平台PAI是指阿里云提供的机器学习平台服务，支持建模、训练和部署机器学习模型；本合集将介绍机器学习PAI的功能和操作流程，以及在使用过程中遇到的问题和解决方案。

真的很搞笑

73 0 0

雪碧有白泡泡

|

7月前

|

机器学习/深度学习人工智能算法

【深度学习】因果推断与机器学习的高级实践 | 数学建模

【深度学习】因果推断与机器学习的高级实践 | 数学建模

雪碧有白泡泡

302 0 0

酷酷的群

|

机器学习/深度学习

受限玻尔兹曼机|机器学习推导系列（二十五）

受限玻尔兹曼机|机器学习推导系列（二十五）

酷酷的群

783 0 0

受限玻尔兹曼机|机器学习推导系列（二十五）

玩机器学习的章北海-13621

|

机器学习/深度学习算法数据挖掘

100天搞定机器学习|day44 k均值聚类数学推导与python实现

100天搞定机器学习|day44 k均值聚类数学推导与python实现

玩机器学习的章北海-13621

151 1 1

100天搞定机器学习|day44 k均值聚类数学推导与python实现

壹佰、

|

机器学习/深度学习人工智能移动开发

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

397 0 0

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

|

机器学习/深度学习人工智能算法

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

壹佰、

404 0 0

【机器学习】线性分类——线性判别分析LDA（理论+图解+公式推导）

玩机器学习的章北海-13621

|

机器学习/深度学习算法

100天搞定机器学习|day38 反向传播算法推导

100天搞定机器学习|day38 反向传播算法推导

玩机器学习的章北海-13621

131 0 0

100天搞定机器学习|day38 反向传播算法推导

酷酷的群

|

机器学习/深度学习算法

Sigmoid信念网络|机器学习推导系列（二十八）

Sigmoid信念网络|机器学习推导系列（二十八）

酷酷的群

284 0 0

Sigmoid信念网络|机器学习推导系列（二十八）

酷酷的群

|

机器学习/深度学习算法

近似推断|机器学习推导系列（二十七）

近似推断|机器学习推导系列（二十七）

酷酷的群

159 0 0

近似推断|机器学习推导系列（二十七）

酷酷的群

|

机器学习/深度学习算法

配分函数|机器学习推导系列（二十六）

配分函数|机器学习推导系列（二十六）

酷酷的群

300 0 0

配分函数|机器学习推导系列（二十六）

热门文章

最新文章

机器学习-异常检测算法（二）：Local Outlier Factor

SLS机器学习最佳实战：批量时序异常检测

机器学习-特征选择：如何使用递归特征消除算法自动筛选出最优特征？

【GTC 22】通过 PAI-Blade 更方便、更鲁棒地使用 TensorRT

Python3入门机器学习 - 模型泛化

机器学习实战之树回归

Andrew Ng机器学习课程笔记--week10(优化梯度下降)

【阿旭机器学习实战】【10】朴素贝叶斯模型原理及3种贝叶斯模型对比：高斯分布朴素贝叶斯、多项式分布朴素贝叶斯、伯努利分布朴素贝叶斯

机器学习/评分卡常用指标及计算

阿里巴巴飞天大数据平台机器学习PAI最新特性

【Python机器学习专栏】Python环境下的机器学习库概览

【python】Python大豆特征数据分析 [机器学习版一]（代码+论文）【独一无二】

机器学习实战第3天：手写数字识别

机器学习库：numpy

机器学习第11天：降维

构建高效机器学习模型的五大技巧

构建高效机器学习模型：从数据预处理到模型优化

构建高效机器学习模型：从特征工程到模型调优

Machine Learning机器学习之贝叶斯网络(BayesianNetwork)

Machine Learning机器学习之决策树算法 Decision Tree（附Python代码）

相关课程

更多

机器学习入门-概念原理及常用算法

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

机器学习概览及常见算法

场景实践 - 基于机器学习进行收入预测分析

PAI平台学习路线：机器学习入门到应用

高校精品课-复旦大学-机器学习与深度学习

相关电子书

更多

大规模机器学习在蚂蚁+阿里的应用

基于Spark的面向十亿级别特征的大规模机器学习

基于Spark的大规模机器学习在微博的应用

相关实验场景

更多

如何快速训练大模型

使用PAI-快速开始，低代码实现大语言模型微调和部署

推荐系统入门之使用ALS算法实现打分预测

下一篇

DataWorks售前咨询