Machine Learning-L15-EM算法全解析(上)

简介: Machine Learning-L15-EM算法全解析

期望极大化(EM,Expectation Maximization)是一种迭代算法,1977年由Dempster等人总结提出,用于含有隐变量(hidden variable)的概率模型参数的极大似然估计或极大后验概率估计。


概率模型有时既含有观测变量(observable variable),又含有隐变量或潜变量(latent variable)。如果概率模型的变量都是观测变量,那么给定数据后,可以直接用极大似然估计或贝叶斯估计;但当模型含有隐变量时(如一个词所属的主题,聚类中的样本列表),难以求得参数的解析解,就需要用到EM算法。


EM算的每次迭代由两步组成:


E步:求期望步(expectation)

M步:求极大(maximization)


1 EM算法的引入


1.1 E.g.1 两硬币模型


(1)一般情况


假设有2枚硬币A,B,正面朝上的概率分别为p1 p2。为了估计正面朝上的概率,每次取一枚硬币,连续抛5次,记录结果如下:


20200407224743369.png

image.png

(2)含有隐变量的情况


若每次使用哪枚硬币抛掷未知,结果如下:


20200407224812330.png

此时相当于增加了隐变量Z = ( z 1 , z 2 , z 3 , z 4 , z 5),其中,zi= 0代表第i 轮使用硬币A抛掷, zi= 1 代表使用硬币B抛掷。


为了估计出p1 p2首先需要估计出Z ,由于p1p2 未知,可先随机初始化 p1 p2,估计出Z ,再利用Z 估计新的p1 p2


方法一:


p1= 0.2 ,p2 = 0.7 ,则在第一轮掷硬币中,


硬币A,3正2反的概率:0.2 ∗ 0.2 ∗ 0.2 ∗ 0.8 ∗ 0.8 = 0.00512

硬币B,3正2反的概率:0.7 ∗ 0.7 ∗ 0.7 ∗ 0.3 ∗ 0.3 = 0.03087


image.png


根据最大似然估计判定得到Z = ( 1 , 0 , 0 , 1 , 0 )硬币A,5正10反;硬币B,6正4反。

p1= 0.33 ,  p2= 0.6 相对于初始值更加接近真实值了。


可按照上述思路,用估计得到的p1p2再来估计Z(E-步),再用Z来估计新的p1p2(M-步),反复迭代下去,直到p1p2的值不再改变。


方法二:


上述方法中,根据每一轮使用A和B的概率,简单判定为非A即B,可不作出判定,而保留使用A和B的概率,即隐变量也是存在分布的。

如第1轮,


使用硬币A的概率:0.00512 / ( 0.00512 + 0.03087 ) = 0.14

使用硬币B的概率:1 − 0.14 = 0.86

依次计算出其他4轮的概率如下:


image.png


此时,完成了对于隐变量Z ZZ的概率分布的估计(E-步),再按照极大似然来估计p1p2M-步)。


如针对硬币A,第1轮3正2反,相当于正面概率为0.14*3=0.42,反面概率为0.14 ∗ 2 = 0.28 ,5轮列表如下:


image.png

此时,p 1 = 4.22 / ( 4.22 + 7.98 ) = 0.35


Do C B , Batzoglou S 在《What is the expectation maximization algorithm?》中提及的类似例子如下:



2020041121412674.png

1.2 E.g.2 三硬币模型


假设有3枚硬币A,B,C,这些硬币正面向上的概率分别为π , p , q 进行如下抛硬币实验:先抛硬币A,根据其结果选择硬币B或C:正面选B,反面选C;然后抛出选择的硬币,出现正面记作1,出现反面记作2。


20200406224927359.png


独立重复n ( n = 10 ) 次试验,观测结果如下:


1101001011


根据观测结果,估计三枚硬币正面向上的概率,即三枚硬币模型参数θ = ( π , p , q )

上述模型可以表示为:


image.png

其中,随机变量x xx是观测变量,表示本次试验观测结果是1或0;随机变量z zz是隐变量,表示未观测到的抛掷硬币A的结果。

注意:随机变量x xx的数据可以观测,随机变量z zz的数据不可观测。


令观测数据X = ( x 1 , x 2 , . . . , x n ) ,未观测数据Z = ( z 1 , z 2 , . . . , z n ) 则观测数据的似然函数:

image.png


求参数θ = ( π , p , q )的极大似然估计:

image.png

上述问题没有解析解,只能通过迭代的方法求解:选取参数的初始值,记作θ 0 = ( π 0 , p 0 , q 0 ) ,不断迭代计算参数的估计值,直至收敛。第j jj次迭代,参数估计值为θ j = ( π j , p j , q j )。其中,第j + 1 次迭代如下


E步:计算模型在参数θ j = ( π j , p j , q j ) 下观测数据y i  来自硬币B的概率:


image.png

M步:计算新的参数估计值:


image.png


假设模型参数θ 0 = ( π 0 , p 0 , q 0 ) = ( 0.5 , 0.5 , 0.5 ),对于x i = 1 与 x i = 0 , i = 1 , 2 , . . . , 10均有μ ( i , 1 ) = 0.5 。

根据迭代,可得到

image.png



image.png

继续迭代得到,

image.png

模型收敛,得到参数θ \thetaθ的极大似然估计:

image.png

π=0.5表示硬币A均匀,p = 0.6 , q = 0.6符合对于数据的直观观察,10次抛硬币中,正面出现了6次。

如果初始值θ 0 = ( 0.4 , 0.6 , 0.7 ) ,迭代后得到模型参数θ ^ = ( 0.4 , 0.537 , 0.643 ) 说明EM算法与初始值的选择有关。

相关文章
|
5月前
|
存储 人工智能 算法
从零掌握贪心算法Java版:LeetCode 10题实战解析(上)
在算法世界里,有一种思想如同生活中的"见好就收"——每次做出当前看来最优的选择,寄希望于通过局部最优达成全局最优。这种思想就是贪心算法,它以其简洁高效的特点,成为解决最优问题的利器。今天我们就来系统学习贪心算法的核心思想,并通过10道LeetCode经典题目实战演练,带你掌握这种"步步为营"的解题思维。
|
6月前
|
机器学习/深度学习 人工智能 搜索推荐
从零构建短视频推荐系统:双塔算法架构解析与代码实现
短视频推荐看似“读心”,实则依赖双塔推荐系统:用户塔与物品塔分别将行为与内容编码为向量,通过相似度匹配实现精准推送。本文解析其架构原理、技术实现与工程挑战,揭秘抖音等平台如何用AI抓住你的注意力。
1502 7
从零构建短视频推荐系统:双塔算法架构解析与代码实现
|
6月前
|
机器学习/深度学习 存储 算法
动态规划算法深度解析:0-1背包问题
0-1背包问题是经典的组合优化问题,目标是在给定物品重量和价值及背包容量限制下,选取物品使得总价值最大化且每个物品仅能被选一次。该问题通常采用动态规划方法解决,通过构建二维状态表dp[i][j]记录前i个物品在容量j时的最大价值,利用状态转移方程避免重复计算子问题,从而高效求解最优解。
691 1
|
6月前
|
算法 搜索推荐 Java
贪心算法:部分背包问题深度解析
该Java代码基于贪心算法求解分数背包问题,通过按单位价值降序排序,优先装入高价值物品,并支持部分装入。核心包括冒泡排序优化、分阶段装入策略及精度控制,体现贪心选择性质,适用于可分割资源的最优化场景。
412 1
贪心算法:部分背包问题深度解析
|
6月前
|
机器学习/深度学习 边缘计算 人工智能
粒子群算法模型深度解析与实战应用
蒋星熠Jaxonic是一位深耕智能优化算法领域多年的技术探索者,专注于粒子群优化(PSO)算法的研究与应用。他深入剖析了PSO的数学模型、核心公式及实现方法,并通过大量实践验证了其在神经网络优化、工程设计等复杂问题上的卓越性能。本文全面展示了PSO的理论基础、改进策略与前沿发展方向,为读者提供了一份详尽的技术指南。
粒子群算法模型深度解析与实战应用
|
6月前
|
机器学习/深度学习 资源调度 算法
遗传算法模型深度解析与实战应用
摘要 遗传算法(GA)作为一种受生物进化启发的优化算法,在复杂问题求解中展现出独特优势。本文系统介绍了GA的核心理论、实现细节和应用经验。算法通过模拟自然选择机制,利用选择、交叉、变异三大操作在解空间中进行全局搜索。与梯度下降等传统方法相比,GA不依赖目标函数的连续性或可微性,特别适合处理离散优化、多目标优化等复杂问题。文中详细阐述了染色体编码、适应度函数设计、遗传操作实现等关键技术,并提供了Python代码实现示例。实践表明,GA的成功应用关键在于平衡探索与开发,通过精心调参维持种群多样性同时确保收敛效率
机器学习/深度学习 算法 自动驾驶
1136 0
|
6月前
|
机器学习/深度学习 人工智能 资源调度
大语言模型的核心算法——简要解析
大语言模型的核心算法基于Transformer架构,以自注意力机制为核心,通过Q、K、V矩阵动态捕捉序列内部关系。多头注意力增强模型表达能力,位置编码(如RoPE)解决顺序信息问题。Flash Attention优化计算效率,GQA平衡性能与资源消耗。训练上,DPO替代RLHF提升效率,MoE架构实现参数扩展,Constitutional AI实现自监督对齐。整体技术推动模型在长序列、低资源下的性能突破。
705 8
|
6月前
|
算法 API 数据安全/隐私保护
深度解析京东图片搜索API:从图像识别到商品匹配的算法实践
京东图片搜索API基于图像识别技术,支持通过上传图片或图片URL搜索相似商品,提供智能匹配、结果筛选、分页查询等功能。适用于比价、竞品分析、推荐系统等场景。支持Python等开发语言,提供详细请求示例与文档。
|
8月前
|
机器学习/深度学习 人工智能 编解码
AI视觉新突破:多角度理解3D世界的算法原理全解析
多视角条件扩散算法通过多张图片输入生成高质量3D模型,克服了单图建模背面细节缺失的问题。该技术模拟人类多角度观察方式,结合跨视图注意力机制与一致性损失优化,大幅提升几何精度与纹理保真度,成为AI 3D生成的重要突破。
911 0

推荐镜像

更多
  • DNS