隐马尔可夫模型|机器学习推导系列(十七)

简介: 隐马尔可夫模型|机器学习推导系列(十七)

一、概述


1. 介绍


动态模型可以类比高斯混合模型这种静态模型,高斯混合模型的特点是“混合”,动态模型的特点是在“混合”的基础上加入了“时间”。动态模型包括多种模型:


F542PXU842_FB91@CH38SLU.png


隐马尔可夫模型是动态模型的一种,它的状态空间是离散的,而另外两种动态模型的状态空间是连续的。


2. 模型


隐马尔可夫模型的概率图模型如下:


BRQ_U2U[J$GJI1B6BQZWBB3.png

                                             概率图模型


YCF{NDF2`J8_UG{XAEK@B%J.png


3. 两个假设


  • 齐次马尔可夫假设


任意时刻的状态只依赖于前一时刻的状态,即:

4BT]CCTTJB(6GR)0{OY1%]N.png


  • 观测独立假设


任意时刻的观测只依赖于当前时刻的状态,即:


}SVY)_X$0HDJIS)~@TW3@NT.png


4. 三个问题


  • Evaluation

RD%DMT_%@U{IILA]DE)N5L5.png


二、Evaluation问题


32NSE})8(B6@WUX60`EX}8P.png

                                             隐马尔可夫模型


1. 前向算法


首先我们有:


C@VSGH_}_A7]1P[5H`R[`}3.png


下面记:

7F3N393H){WDRYEA746_EOX.png

(4~E362IY5MO@B57}3%VJNH.png

2. 后向算法

5U{KD123W[Y4WHY(Q9U1E7G.png

0_B6O1(W%AJ(~G29VSTWW4W.png


上式中红色的一步变换利用了概率图模型中有向图head to tail结构的性质:


TI8`YS0_TX@]X2]767LKFP9.png

                   head to tail


这种结构满足:

QX_%DTI6R8{BW(57IS4X]@N.png

三、Learning问题


Learning问题的目标是求解参数90K6VI6Y_QGC9XZ(QC110ZU.png,使用的是Baum Welch算法(也就是EM算法)。

EM算法的迭代公式如下:

}1`[[RKLTN~Z1R3YSP6EA6Y.png

@H$SRZ}RKR%T)JF47{RX0$M.png

9~8R((VYS}%P1V6ZLU5YDEY.png

四、Decoding问题

044FNV`G_QEOQ8J`)F]T099.png

因此:


}C8$RQ`C1O2{HQQBG5A6@_X.png


五、总结


HMM 是⼀种动态模型(Dynamic Model),是由混合树形模型和时序结合起来的⼀种模型(类似 GMM + Time)。对于类似 HMM 的这种状态空间模型(State Space Model),普遍的除了学习任务(采⽤ EM )外,还有推断任务。


P4@}[X`FXXVNM])O585XZAK.png


1. Filtering问题

HG~7}TABS5DS6(R}UZB[694.png


因此使用Forward Algorithm来解决Filtering问题。


Filtering问题通常出现在online learning中,当新进入一个数据,可以计算概率0(%CMN{SIQ6QG5Z3]9TM1{U.png


2. Smoothing问题

HORW4A7W[9Q4$QU(MPWCH~8.png


其中:A[AX0YYGAF5F_1IVG8AE`~E.png



3. Prediction问题


(GD6UWM%8S$KS0L9`91T2Y5.png


相关文章
|
14天前
|
机器学习/深度学习 存储 设计模式
特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法
本文探讨了数据基础设施设计中常见的一个问题:数据仓库或数据湖仓中的表格缺乏构建高性能机器学习模型所需的历史记录,导致模型性能受限。为解决这一问题,文章介绍了缓慢变化维度(SCD)技术,特别是Type II类型的应用。通过SCD,可以有效追踪维度表的历史变更,确保模型训练数据包含完整的时序信息,从而提升预测准确性。文章还从数据工程师、数据科学家和产品经理的不同视角提供了实施建议,强调历史数据追踪对提升模型性能和业务洞察的重要性,并建议采用渐进式策略逐步引入SCD设计模式。
28 8
特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法
|
17天前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
124 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
6天前
|
机器学习/深度学习 安全 PyTorch
FastAPI + ONNX 部署机器学习模型最佳实践
本文介绍了如何结合FastAPI和ONNX实现机器学习模型的高效部署。面对模型兼容性、性能瓶颈、服务稳定性和安全性等挑战,FastAPI与ONNX提供了高性能、易于开发维护、跨框架支持和活跃社区的优势。通过将模型转换为ONNX格式、构建FastAPI应用、进行性能优化及考虑安全性,可以简化部署流程,提升推理性能,确保服务的可靠性与安全性。最后,以手写数字识别模型为例,展示了完整的部署过程,帮助读者更好地理解和应用这些技术。
43 18
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
云上一键部署 DeepSeek-V3 模型,阿里云 PAI-Model Gallery 最佳实践
本文介绍了如何在阿里云 PAI 平台上一键部署 DeepSeek-V3 模型,通过这一过程,用户能够轻松地利用 DeepSeek-V3 模型进行实时交互和 API 推理,从而加速 AI 应用的开发和部署。
|
3天前
如何看PAI产品下训练(train)模型任务的费用细节
PAI产品下训练(train)模型任务的费用细节
18 4
|
2月前
|
人工智能 JSON 算法
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式、 AI Native 的大模型与 AIGC 工程平台,为开发者和企业客户提供了 Qwen2.5-Coder 系列模型的全链路最佳实践。本文以Qwen2.5-Coder-32B为例,详细介绍在 PAI-QuickStart 完成 Qwen2.5-Coder 的训练、评测和快速部署。
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
|
1月前
|
编解码 机器人 测试技术
技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人
Qwen2-VL是一款具备高级图像和视频理解能力的多模态模型,支持多种语言,适用于多模态应用开发。通过PAI和LLaMA Factory框架,用户可以轻松微调Qwen2-VL模型,快速构建文旅领域的知识问答机器人。本教程详细介绍了从模型部署、微调到对话测试的全过程,帮助开发者高效实现定制化多模态应用。
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
57 12
|
2月前
|
机器学习/深度学习 Python
机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况
本文介绍了机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况,而ROC曲线则通过假正率和真正率评估二分类模型性能。文章还提供了Python中的具体实现示例,展示了如何计算和使用这两种工具来评估模型。
89 8
|
2月前
|
机器学习/深度学习 Python
机器学习中模型选择和优化的关键技术——交叉验证与网格搜索
本文深入探讨了机器学习中模型选择和优化的关键技术——交叉验证与网格搜索。介绍了K折交叉验证、留一交叉验证等方法,以及网格搜索的原理和步骤,展示了如何结合两者在Python中实现模型参数的优化,并强调了使用时需注意的计算成本、过拟合风险等问题。
87 6