高斯混合模型|机器学习推导系列(十三)

简介: 高斯混合模型|机器学习推导系列(十三)

一、概述


对于高斯混合模型的假设,首先来看以下两个例子。


首先以一维数据为例,我们可以看到下图通过将多个单一的高斯模型加权叠加到一起就可以获得一个高斯混合模型,这个混合模型显然具备比单个高斯模型更强的拟合能力:


`EYH5J$_O1EZ_K1VANSZXA0.png

                                          高斯混合模型


再举一个二维数据的例子,在下图中可以看到有两个数据密集区域,对应的概率分布也就会有两个峰。高斯混合模型可以看做生成模型,其数据生成过程可以认为先选择一个高斯分布,再从被选择的高斯分布中生成数据:


8DS~B0MP7FG~_)GYG`F}0%6.png

                                         高斯混合模型


综合上述两个例子,我们可以从两种角度来描述高斯混合模型:


  1. 几何角度:加权平均


可以认为高斯混合模型是将多个高斯分布加权平均而成的模型:


9F$N25%LWD~6W$5{}ZRZ4$2.png


  1. 混合模型(或者生成模型)角度


可以认为高斯混合模型是一种含有隐变量的生成模型:


[ADN6Y}})PQNL(K7GN2OR_C.png


我们可以画出高斯混合模型的概率图:


[`DTW64E[PNNC]9~U1~J9J1.png

                                    概率图


实心点代表模型的参数,右下角的E@AXYJ5Y89K2(H$ZUODGHBW.png代表样本个数。


二、尝试用极大似然估计来求解


GRV`)LW5~MZ]3ZZKMP]XO)X.png

然后我们使用极大似然估计法求解这个参数估计问题。首先告知结论:极大似然估计法无法求解含有隐变量的参数估计问题,或者说不能得到解析解。接下来来看为什么不能用极大似然估计法来求解:


YD%GU]UJ$A2H628QXT`6KLR.png

极大似然估计法不能得到解析解的原因为AV90@Z%$DM4WTU(_70G`Z~O.png函数内部出现了求和符号。当然我们可以使用梯度下降法来进行求解,但是对于含有隐变量的模型来说使用EM算法是更为合适的。


三、使用EM算法求解

Q_ABRC)5ZKFOJ1LCH2J[ZYU.png

  1. E step


4HV`~V{LQ}A9PAMLQ}HS73V.png


对于上式展开的每一项,我们可以进行化简:


]$X15[$N1U%5ROI5(1W_PFT.png


同样的我们可以得到:


K_7$ZDO0OJ69(T%D[A]9`NQ.png

XPT1H9PMC[[NC81)7]01)EQ.png


  1. M step


EM算法的迭代公式为:


TH9CSA{_]I}$S_2W42Q@VYA.png

QI]7S34%ZX%5ZPKS0YKZND1.png


于是可以转化为以下约束优化问题:


5Z1P65`H2`]U8}U@}U_WU2Q.png


然后使用拉格朗日乘子法进行求解:[{DJ75LG`B5WW6FZU]9]6VH.png



[{DJ75LG`B5WW6FZU]9]6VH.png[{DJ75LG`B5WW6FZU]9]6VH.png[{DJ75LG`B5WW6FZU]9]6VH.png

相关文章
|
机器学习/深度学习
受限玻尔兹曼机|机器学习推导系列(二十五)
受限玻尔兹曼机|机器学习推导系列(二十五)
775 0
受限玻尔兹曼机|机器学习推导系列(二十五)
|
机器学习/深度学习 算法 数据挖掘
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
|
机器学习/深度学习 人工智能 移动开发
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
368 0
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 算法
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
348 0
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
|
机器学习/深度学习 算法
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
|
机器学习/深度学习
MCMC-1|机器学习推导系列(十五)
MCMC-1|机器学习推导系列(十五)
362 0
MCMC-1|机器学习推导系列(十五)
|
机器学习/深度学习 算法
变分推断|机器学习推导系列(十四)
变分推断|机器学习推导系列(十四)
213 0
变分推断|机器学习推导系列(十四)
|
机器学习/深度学习 算法
Sigmoid信念网络|机器学习推导系列(二十八)
Sigmoid信念网络|机器学习推导系列(二十八)
276 0
Sigmoid信念网络|机器学习推导系列(二十八)
|
机器学习/深度学习 算法
近似推断|机器学习推导系列(二十七)
近似推断|机器学习推导系列(二十七)
152 0
近似推断|机器学习推导系列(二十七)
|
机器学习/深度学习 算法
配分函数|机器学习推导系列(二十六)
配分函数|机器学习推导系列(二十六)
288 0
配分函数|机器学习推导系列(二十六)
下一篇
无影云桌面