隐马尔可夫模型|机器学习推导系列(十七)

简介: 隐马尔可夫模型|机器学习推导系列(十七)

一、概述


1. 介绍


动态模型可以类比高斯混合模型这种静态模型,高斯混合模型的特点是“混合”,动态模型的特点是在“混合”的基础上加入了“时间”。动态模型包括多种模型:


F542PXU842_FB91@CH38SLU.png


隐马尔可夫模型是动态模型的一种,它的状态空间是离散的,而另外两种动态模型的状态空间是连续的。


2. 模型


隐马尔可夫模型的概率图模型如下:


BRQ_U2U[J$GJI1B6BQZWBB3.png

                                             概率图模型


YCF{NDF2`J8_UG{XAEK@B%J.png


3. 两个假设


  • 齐次马尔可夫假设


任意时刻的状态只依赖于前一时刻的状态,即:

4BT]CCTTJB(6GR)0{OY1%]N.png


  • 观测独立假设


任意时刻的观测只依赖于当前时刻的状态,即:


}SVY)_X$0HDJIS)~@TW3@NT.png


4. 三个问题


  • Evaluation

RD%DMT_%@U{IILA]DE)N5L5.png


二、Evaluation问题


32NSE})8(B6@WUX60`EX}8P.png

                                             隐马尔可夫模型


1. 前向算法


首先我们有:


C@VSGH_}_A7]1P[5H`R[`}3.png


下面记:

7F3N393H){WDRYEA746_EOX.png

(4~E362IY5MO@B57}3%VJNH.png

2. 后向算法

5U{KD123W[Y4WHY(Q9U1E7G.png

0_B6O1(W%AJ(~G29VSTWW4W.png


上式中红色的一步变换利用了概率图模型中有向图head to tail结构的性质:


TI8`YS0_TX@]X2]767LKFP9.png

                   head to tail


这种结构满足:

QX_%DTI6R8{BW(57IS4X]@N.png

三、Learning问题


Learning问题的目标是求解参数90K6VI6Y_QGC9XZ(QC110ZU.png,使用的是Baum Welch算法(也就是EM算法)。

EM算法的迭代公式如下:

}1`[[RKLTN~Z1R3YSP6EA6Y.png

@H$SRZ}RKR%T)JF47{RX0$M.png

9~8R((VYS}%P1V6ZLU5YDEY.png

四、Decoding问题

044FNV`G_QEOQ8J`)F]T099.png

因此:


}C8$RQ`C1O2{HQQBG5A6@_X.png


五、总结


HMM 是⼀种动态模型(Dynamic Model),是由混合树形模型和时序结合起来的⼀种模型(类似 GMM + Time)。对于类似 HMM 的这种状态空间模型(State Space Model),普遍的除了学习任务(采⽤ EM )外,还有推断任务。


P4@}[X`FXXVNM])O585XZAK.png


1. Filtering问题

HG~7}TABS5DS6(R}UZB[694.png


因此使用Forward Algorithm来解决Filtering问题。


Filtering问题通常出现在online learning中,当新进入一个数据,可以计算概率0(%CMN{SIQ6QG5Z3]9TM1{U.png


2. Smoothing问题

HORW4A7W[9Q4$QU(MPWCH~8.png


其中:A[AX0YYGAF5F_1IVG8AE`~E.png



3. Prediction问题


(GD6UWM%8S$KS0L9`91T2Y5.png


相关文章
|
4月前
|
人工智能 JSON 算法
【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。
|
2月前
|
机器学习/深度学习 算法 安全
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
本文探讨在敏感数据上应用差分隐私(DP)进行机器学习的挑战与实践。通过模拟DP-SGD算法,在模型训练中注入噪声以保护个人隐私。实验表明,该方法在保持71%准确率和0.79 AUC的同时,具备良好泛化能力,但也带来少数类预测精度下降的问题。研究强调差分隐私应作为模型设计的核心考量,而非事后补救,并提出在参数调优、扰动策略选择和隐私预算管理等方面的优化路径。
182 3
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
|
2月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。
|
2月前
|
机器学习/深度学习 存储 Java
Java 大视界 -- Java 大数据机器学习模型在游戏用户行为分析与游戏平衡优化中的应用(190)
本文探讨了Java大数据与机器学习模型在游戏用户行为分析及游戏平衡优化中的应用。通过数据采集、预处理与聚类分析,开发者可深入洞察玩家行为特征,构建个性化运营策略。同时,利用回归模型优化游戏数值与付费机制,提升游戏公平性与用户体验。
|
2月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在舆情分析中的情感倾向判断与话题追踪(185)
本篇文章深入探讨了Java大数据与机器学习在舆情分析中的应用,重点介绍了情感倾向判断与话题追踪的技术实现。通过实际案例,展示了如何利用Java生态工具如Hadoop、Hive、Weka和Deeplearning4j进行舆情数据处理、情感分类与趋势预测,揭示了其在企业品牌管理与政府决策中的重要价值。文章还展望了多模态融合、实时性提升及个性化服务等未来发展方向。
|
3月前
|
缓存 人工智能 负载均衡
PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长
阿里云人工智能平台PAI 平台推出模型权重服务,通过分布式缓存架构、RDMA高速传输、智能分片等技术,显著提升大语言模型部署效率,解决模型加载耗时过长的业界难题。实测显示,Qwen3-32B冷启动时间从953秒降至82秒(降幅91.4%),扩容时间缩短98.2%。
|
机器学习/深度学习 数据采集 算法
Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)
本文围绕 Java 大数据机器学习模型在金融衍生品定价中的应用展开,分析定价现状与挑战,阐述技术原理与应用,结合真实案例与代码给出实操方案,助力提升金融衍生品定价的准确性与效率。
Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
MiniMax公司6月17日推出4560亿参数大模型M1,采用混合专家架构和闪电注意力机制,支持百万级上下文处理,高效的计算特性使其特别适合需要处理长输入和广泛思考的复杂任务。阿里云PAI-ModelGallery现已接入该模型,提供一键部署、API调用等企业级解决方案,简化AI开发流程。
|
3月前
|
机器学习/深度学习 人工智能 JSON
DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践
通过 PAI-ModelGallery,可一站式零代码完成 DistilQwen-ThoughtX 系列模型的训练、评测、压缩和部署。