【发布时间】:2014-02-27 03:46:22
【问题描述】:
我正在做一个项目,我需要使用 Viterbi 算法对句子列表进行词性标注。对于我的训练数据,我有一些已经用单词标记的句子,我认为我需要解析并存储在一些数据结构中。然后我有一个测试数据,其中还包含每个单词都被标记的句子。
我对如何解决这个问题有点困惑。我想部分问题源于我认为我没有完全理解维特比算法的要点。我是否应该使用 Viterbi 算法来标记我的测试数据并将结果与实际数据进行比较?什么数据结构最适合做这件事并表示一个句子?
任何帮助将不胜感激。
【问题讨论】: