【发布时间】:2015-02-21 00:19:47
【问题描述】:
我是 CRF 的新手,我的一些术语可能有偏差,所以请耐心等待。我假设斯坦福 NER 实现了线性链 CRF。
设 x 是单词序列,y 是对应标签的序列。将 x 称为示例,将 y 称为其标签。 x 的一个分量 x_i 是一个词。 y 的一个分量 y_i 是一个标签。
-
在训练模型时,我们会为它提供如下内容:
James PERSON lives O in O Chicago LOCATION . O Coffee O in O Trieste LOCATION is O great O . O模型是否使用单个句子作为示例?使用上面的数据是示例之一:?这是否意味着特征函数不能依赖于前面句子中的单词?
如果确实如此,模型如何确保每个示例确实是一个句子?它是否进行任何句子边界检测?可以看一下吗? 4个句子的批次?
提前谢谢你:)
【问题讨论】:
标签: stanford-nlp