【发布时间】:2016-08-15 10:30:09
【问题描述】:
假设我想预测一个人是class1=healthy 还是class2= fever。我有一个具有以下域的数据集:{normal,cold,dizzy}
转换矩阵将包含从我们的训练数据集生成的转换概率,而初始向量将包含一个人从域{normal,cold,dizzy} 以状态 x 开始(第 1 天)的概率,这也是从我们的训练集。
如果我想构建一阶马尔可夫链,我会生成一个 3x3 转换矩阵和每个类的 1x3 初始向量,如下所示:
> TransitionMatrix
normal cold dizzy
normal NA NA NA
cold NA NA NA
dizzy NA NA NA
>Initial Vector
normal cold dizzy
[1,] NA NA NA
NA 将填充相应的概率。
1-我的问题是关于高阶链中的转换矩阵。例如,在二阶 MC 中,我们是否会有一个大小为 domain²xdomain² 的转换矩阵,如下所示:
normal->normal normal->cold normal->dizzy cold->normal cold->cold cold->dizzy dizzy->normal dizzy->cold dizzy->dizzy
normal->normal NA NA NA NA NA NA NA NA NA
normal->cold NA NA NA NA NA NA NA NA NA
normal->dizzy NA NA NA NA NA NA NA NA NA
cold->normal NA NA NA NA NA NA NA NA NA
cold->cold NA NA NA NA NA NA NA NA NA
cold->dizzy NA NA NA NA NA NA NA NA NA
dizzy->normal NA NA NA NA NA NA NA NA NA
dizzy->cold NA NA NA NA NA NA NA NA NA
dizzy->dizzy NA NA NA NA NA NA NA NA NA
这里的单元格(1,1)代表以下序列:normal->normal->normal->normal
或者只是像这样domain²xdomain:
normal cold dizzy
normal->normal NA NA NA
normal->cold NA NA NA
normal->dizzy NA NA NA
cold->normal NA NA NA
cold->cold NA NA NA
cold->dizzy NA NA NA
dizzy->normal NA NA NA
dizzy->cold NA NA NA
dizzy->dizzy NA NA NA
这里的单元格(1,1)代表normal->normal->normal,这与之前的表示不同
2- 2 次 MC 的初始向量怎么样。我们是否需要两个大小为 1xdomain 的初始向量,如下所示:
normal cold dizzy
[1,] NA NA NA
导致每个类有两个初始向量。第一个给出{normal,cold,dizzy} 在第一天出现healthy/fever 类的概率,第二个给出healthy/fever 在第二天出现的概率。这将给出 4 个初始向量。
或者我们是否只需要一个大小为1xdomain²的初始向量,如下所示:
normal->normal normal->cold normal->dizzy cold->normal cold->cold cold->dizzy dizzy->normal dizzy->cold dizzy->dizzy
[1,] NA NA NA NA NA NA NA NA NA
我可以看到,如果我们想对仅具有一种状态的观察进行分类,则表示初始向量的第二种方式会出现问题。
【问题讨论】: