配分函数|机器学习推导系列(二十六)

简介: 配分函数|机器学习推导系列(二十六)

一、概述


对于有向概率图模型来说,由于图中存在天然的拓扑排序关系,所以有向概率图的因式分解的形式很容易写出来。而对于无向图来说就需要根据它图中的最大团来写成一个因式分解的形式,无向图模型在局部并没有表现出是一个概率模型,在整体上才表现地是一个概率模型,由此我们也就遇到了配分函数。在无向图模型的学习和评估问题中,我们会面对概率公式中的配分函数(Partition Function),往往这个配分函数是很难处理的。


对于连续或离散的高维随机变量GSERBU]IAK7A@7V9OKQ))@0.png,它可以表示成一个无向概率图,模型参数为9KVPQH{C7T8{V2J[N$Q%D(F.png,它的概率公式也就可以写成以下形式:

]R2L5U$%TT1AVD6G9FDT4WB.png

其中Q2DLPX)@)}R{T(Y1DA5H_9U.png也就是配分函数,可以表示为:

Q}]J%4D_PKS9C93_4GBP67I.png


对于这个概率模型的参数估计,可以采用极大似然估计的方法,首先,我们有一些样本,表示为Z]0ZLIJNZ0M8TX%$B9UCO79.png,然后使用这些样本来做极大似然估计:

`ZJ(8BB(7_%OHQNTZMKYDYT.png


这里我们也就得到了目标函数TKZIP8FQ@ZA)`G86`_C4N7E.png

~THMH3$@0}VHQLQF2@0SA)1.png

接下来使用梯度上升的方法来求解参数[90F0(]D)T$~ZP][(IHU3KI.png求导:

GICP]8V)GF)OMW~I3EL$Q$5.png


这里我们首先看一下②这一项的求导:

}U@PHP0B%_OK`6NHV]C(O_W.png

注意这里的69DT~O8{HB(0A8RC~UC2RGF.png之所以能够放到积分号里面,是因为对于任意GA4VI16DWBRNKT$@7XX)HLE.png来说69DT~O8{HB(0A8RC~UC2RGF.png都是个常数。

{QKS8[()[O9S5X4D9ESJSQM.png


二、随机最大似然(Stochastic Maximum Likelihood)


B}J_D[9LJ40{8$)75}V_X`8.png


这里分别定义等号左边和右边的部分为正相(positive phase)和负相(negative phase)。

BH~O}}JU)U)MQ6V6RIUZZ1C.png

这个方法就叫做Gradient Ascent based on MCMC。

QHH30MPCK)5]%6(5LUR)6YM.png

                                            正负相的作用

可以想象如果JCH90QR}N3{UL6F28O[}M00.png已经非常逼近LR`N_VYJG$Y_P@UIJ()52V9.png,那么采样得到的幻想粒子和从数据集中采样的样本就会非常一致,这时对这些样本既要增大它们的概率也要压低它们的概率,此时正相和负相的作用就会抵消,也就不会再产生梯度,训练也就必须停止。


三、对比散度


对于MCMC的方法,可以参考这两个链接:


MCMC-1|机器学习推导系列(十五)


MCMC-2|机器学习推导系列(十六)

AXQ)`VSK[X_1YF(S]9HGK%6.png9[98VU8N1[NC53VZ6X~7LQJ.png

这个目标函数就是对比散度。使用CD-Learning的方法的算法如下:


DGZ9}1WIAJG]B7J71OLC5NU.png

四、受限玻尔兹曼机的学习


  1. 表示


受限玻尔兹曼机在前一篇介绍了它的表示和推断问题,参考链接如下:受限玻尔兹曼机|机器学习推导系列(二十五)


它的概率模型如下:


_QVCY8~UGRWH2N2Z7O}J](C.png

GT(@PYK6CJ__]3RLDI~QL`F.png

O}EIY0G38DO%@}NWU77MHZJ.png

`B71BF}ARHT]%$U6WL7XK$8.png

P3YD{L%)6[98ZNRY7ST3W1W.png

1WN4U5AA@41WI(DH5`J`)@4.png

  1. RBM的CD-k方法


2J(B)52UP~YAA8HWMV_V{2W.png

                                                 CD-k


YD7LJFPIVPY4]NO2XJY0_HT.png


H_(XEV`)5IL`[[2H)MD~Y}G.png

最后进行梯度上升迭代求解就可以了。

相关文章
|
机器学习/深度学习
受限玻尔兹曼机|机器学习推导系列(二十五)
受限玻尔兹曼机|机器学习推导系列(二十五)
783 0
受限玻尔兹曼机|机器学习推导系列(二十五)
|
机器学习/深度学习 算法 数据挖掘
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
|
机器学习/深度学习 人工智能 移动开发
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
396 0
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 算法
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
402 0
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
|
机器学习/深度学习 算法
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
|
机器学习/深度学习
MCMC-1|机器学习推导系列(十五)
MCMC-1|机器学习推导系列(十五)
370 0
MCMC-1|机器学习推导系列(十五)
|
机器学习/深度学习 算法
变分推断|机器学习推导系列(十四)
变分推断|机器学习推导系列(十四)
219 0
变分推断|机器学习推导系列(十四)
|
机器学习/深度学习 算法
Sigmoid信念网络|机器学习推导系列(二十八)
Sigmoid信念网络|机器学习推导系列(二十八)
284 0
Sigmoid信念网络|机器学习推导系列(二十八)
|
机器学习/深度学习 算法
近似推断|机器学习推导系列(二十七)
近似推断|机器学习推导系列(二十七)
159 0
近似推断|机器学习推导系列(二十七)
|
机器学习/深度学习
高斯过程回归|机器学习推导系列(二十四)
高斯过程回归|机器学习推导系列(二十四)
540 0
高斯过程回归|机器学习推导系列(二十四)