隐马尔可夫模型

先用一个例子帮助理解：
隐马尔可夫模型
假设有三个骰子，分别为D6, D4, D8, 选中每个骰子的概率为13, 每次选取一枚骰子进行抛掷，得到的数字为{1，2，3，4，5，6，7，8}中的一个，重复10次得到一串数字为[1 6 3 5 2 7 3 5 2 4]，这些观测变量称为可观测状态序列。
在隐马尔可夫模型下，还存在一串隐含状态链，在这个例子里，这串隐含状态链就是我们使用骰子的序列，比如为D6 D8 D8 D6 D4 D8 D6 D6 D4 D8，

在这个例子里，D6的下一个状态可能是D4，D6和D8，其概率都是13。D4，D8的下一个状态可能是D4，D6和D8，其转换概率也都一样是13。在隐含状态和可见状态之间有一个概率叫做输出概率（emission probability），比如D6骰子抛掷一次为1的概率为16，D4出现1的概率为 13。
在实际应用中，所有隐含状态之间的转换概率和所有隐含状态到所有可见状态之间的输出概率并不是都是已知的。

1. 隐马尔可夫模型定义
隐马尔可夫模型：是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机产生不可观测的状态随机序列（也就是例子中使用骰子的序列），再由各个状态生成一个观测进而产生观测随机序列的过程（由选出的筛子抛掷结果的过程）。
隐马尔可模型有初始概率分布、状态转移概率分布以及观测概率分布确定。
其定义：设Q是所有可能的状态集合（有几种类型的骰子），V是所有可能的观测集合（骰子出现的数字）。Q = { q1,q2,...,qN}, V= {v1,v2,....,vM}, 其中，N是可能的状态数，M是可能的观测数。I 是长度为T的状态序列，O是对应的观测序列。
A是状态转移概率矩阵A=[aij]N×N,其中：
隐马尔可夫模型是在时刻 t 处于状态 qi 的条件下在时刻 t+1 转移到状态 qj 的概率(即D6到D8的概率)。
B是观测概率矩阵：B=[bj(k)]N×M, 其中：
是在时刻t处于状态qj的条件下生成观测vk的概率(即由骰子出现数字的概率)。
π是初始状态概率向量：π=(πi), 其中，

是时刻 t=1 处于状态 qi 的概率。
隐马尔可夫模型由初始状态概率向量π、状态转移概率矩阵A和观测概率矩阵B决定，π和A决定状态序列，B决定观测序列，因此马尔可夫模型 λ 可以用三元符表示：λ=(A,B,π)。

2. 隐马尔可夫模型的两个基本假设：

齐次马尔可夫性假设，即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于其前一时刻的状态，与其他时刻的状态及观测无关，也与时刻t无关。
观测独立性假设，即假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他观测与状态无关。

3. 隐马尔可夫模型的3个基本问题：
概率计算。给定模型 λ 和观测序列 O, 计算装在模型 λ 下观测序列 O 出现的概率。即知道有几种类型的骰子，每种骰子是什么，根据抛掷骰子的结果，推断抛掷结果的概率。
学习问题。已知观测序列 O，估计模型 λ 参数，使得在该模型下观测序列概率最大，即用极大似然估计方法估计参数。即已知有几种骰子，不知道每种骰子是什么，根据抛掷骰子的结果，反推每种骰子是什么。
预测问题。也称为解码问题，已知模型 λ 和观测序列O，求对给定观测序列，求最有可能的对应状态序列。即已知有几种骰子，每种骰子是什么，根据抛掷骰子的结果判断每次是抛出的是哪种骰子。

学习参考：
https://www.cnblogs.com/skyme/p/4651331.html