先用一个例子帮助理解:
假设有三个骰子,分别为D6, D4, D8, 选中每个骰子的概率为
在隐马尔可夫模型下,还存在一串隐含状态链,在这个例子里,这串隐含状态链就是我们使用骰子的序列,比如为D6 D8 D8 D6 D4 D8 D6 D6 D4 D8,
在这个例子里,D6的下一个状态可能是D4,D6和D8,其概率都是
在实际应用中,所有隐含状态之间的转换概率和所有隐含状态到所有可见状态之间的输出概率并不是都是已知的。
1. 隐马尔可夫模型定义
隐马尔可夫模型:是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机产生不可观测的状态随机序列(也就是例子中使用骰子的序列),再由各个状态生成一个观测进而产生观测随机序列的过程(由选出的筛子抛掷结果的过程)。
隐马尔可模型有初始概率分布、状态转移概率分布以及观测概率分布确定。
其定义:设Q是所有可能的状态集合(有几种类型的骰子),V是所有可能的观测集合(骰子出现的数字)。Q = {
A是状态转移概率矩阵是在时刻
B是观测概率矩阵:是在时刻t处于状态
是时刻 t=1 处于状态
隐马尔可夫模型由初始状态概率向量
2. 隐马尔可夫模型的两个基本假设:
- 齐次马尔可夫性假设,即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于其前一时刻的状态,与其他时刻的状态及观测无关,也与时刻t无关。
-
观测独立性假设,即假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态,与其他观测与状态无关。
3. 隐马尔可夫模型的3个基本问题:
概率计算。给定模型
λ 和观测序列O , 计算装在模型λ 下观测序列O 出现的概率。即知道有几种类型的骰子,每种骰子是什么,根据抛掷骰子的结果,推断抛掷结果的概率。- 学习问题。已知观测序列
O ,估计模型λ 参数,使得在该模型下观测序列概率最大,即用极大似然估计方法估计参数。即已知有几种骰子,不知道每种骰子是什么,根据抛掷骰子的结果,反推每种骰子是什么。 -
预测问题。也称为解码问题,已知模型
λ 和观测序列O ,求对给定观测序列,求最有可能的对应状态序列。即已知有几种骰子,每种骰子是什么,根据抛掷骰子的结果判断每次是抛出的是哪种骰子。