1. 概念
隐马尔科夫模型 Hidden Markov models (HMMs) 中,变量variables可以在状态states之间转换,各种转换的概率不同。每个状态都能以某一概率产生输出output之一。状态和输出的集合已知,输出已知,状态转换概率和输出概率等信息位置(隐)。
需要解决的问题:
- 推理:根据输出序列计算candidate state-switch sequences的概率
- 模式匹配:根据输出序列计算最可能是的state-switch sequence(Viterbi算法:信号处理领域)
- 训练:给出输出序列(训练)数据,计算最可能出现的state-switch/output probabilities (ie, system internals)
模式匹配和训练任务事实上就是Naive Bayesian推理1延伸到了序列数据上。
假设:
- 状态转换的概率取决于前N个状态。最简单的N=1就是‘first-order’ case,仅基于当前状态决定
- 生成输出结果的概率仅取决于当前概率。
给定state-switch sequence和对应的observed-output sequence,可以直接用每个概率通过乘法计算出整体的概率。
2. 用法
- 语音识别:waveform是输出序列,匹配音素(状态)序列