变分推断|机器学习推导系列(十四)

简介: 变分推断|机器学习推导系列(十四)

一、概述


对于概率模型来说,如果从频率派角度来看就会是一个优化问题,从贝叶斯角度来看就会是一个积分问题。首先从频率派角度角度来看,我们假设模型的最优参数是一个确定的常数。回想之前的线性回归,我们使用最小二乘法来定义损失函数;在支持向量机中最终转化为一个约束优化问题;在EM算法中我们迭代求解模型的参数。这些算法的共同点是从参数空间中寻找最优的参数,因此最终都会演化成一个优化问题。


那么为什么从贝叶斯角度来看就会是一个积分问题呢?现在以贝叶斯的角度来看待问

题,模型的参数此时并非确定的常数,而是服从一个分布。如果已有多个样本数据记作MTH{SMP6MM1@U7DLPLV1NRO.png,对于新的样本Z`GB8)3PRUDV5B_TTJA`1TW.png,需要得到:

2QNEC9U@Q](]@%(R2AS)8X9.png


如果新样本和数据集独立,那么这个推断问题就是求概率分布依参数后验分布的期望。推断问题的核心是参数后验分布的求解,推断分为:


  1. 精确推断


  1. 近似推断-参数空间无法精确求解:



①确定性近似-如变分推断


②随机近似-如 MCMC,MH,Gibbs


二、公式导出


有以下数据:

Y51]N~4XQ%8DO12Q8]YGZ{G.png

7HD)JZQL7DQCCCIVJ7$CFN4.png


对于②:

E`_]PDFL4DMG4V]JVN@F(NT.png

三、回顾EM算法

]9KF((J38M7LE_GERF0W{{H.png

~VJN@E6L7BX{({@4$0Z%8N0.png


~VJN@E6L7BX{({@4$0Z%8N0.png

基于平均场假设的变分推断存在⼀些问题:


①假设太强,⾮常复杂的情况下,假设不适⽤;


②期望中的积分,可能⽆法计算。


四、随机梯度变分推断(SGVI)


  1. 直接求导数的方法

A}SH$@FL(U[1~DIT_LFC4`B.png

OS0O%3O(7B1LKNJ]_8WK9PL.png


这个期望可以通过蒙特卡洛采样来近似,从⽽得到梯度,然后利⽤梯度上升的⽅法来得到参数:


W0VT`6OJ699GGNH8V[XA()C.png


I`M6GH`2FUZ5XF12XX7HI8L.png


  1. 重参数化技巧


1P}]IC88_@YL0CQV{FESDOP.png


对最终这个中括号里的式子进行蒙特卡洛采样,然后计算期望,得到梯度。这里的采样就是从XOZT5W7PVL)$%I7Y@N8V708.png中进行采样了。


SGVI的迭代过程为:


AUF}}BQZ@JQ4A@4DC{FYZ_C.png


蒙特卡洛采样的方法会在后面的文章中介绍。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 JSON
人工智能平台PAI问题之推断报错如何解决
人工智能平台PAI是指阿里云提供的机器学习平台服务,支持建模、训练和部署机器学习模型;本合集将介绍机器学习PAI的功能和操作流程,以及在使用过程中遇到的问题和解决方案。
|
1月前
|
机器学习/深度学习 人工智能 算法
【深度学习】因果推断与机器学习的高级实践 | 数学建模
【深度学习】因果推断与机器学习的高级实践 | 数学建模
|
机器学习/深度学习
受限玻尔兹曼机|机器学习推导系列(二十五)
受限玻尔兹曼机|机器学习推导系列(二十五)
677 0
受限玻尔兹曼机|机器学习推导系列(二十五)
|
机器学习/深度学习 人工智能 移动开发
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
285 0
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 算法
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
186 0
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
|
机器学习/深度学习 算法 数据挖掘
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
|
机器学习/深度学习 算法
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
|
机器学习/深度学习 算法
Sigmoid信念网络|机器学习推导系列(二十八)
Sigmoid信念网络|机器学习推导系列(二十八)
217 0
Sigmoid信念网络|机器学习推导系列(二十八)
|
机器学习/深度学习 算法
近似推断|机器学习推导系列(二十七)
近似推断|机器学习推导系列(二十七)
120 0
近似推断|机器学习推导系列(二十七)
|
机器学习/深度学习 算法
配分函数|机器学习推导系列(二十六)
配分函数|机器学习推导系列(二十六)
229 0
配分函数|机器学习推导系列(二十六)