【问题标题】:how to use pos tag as feature in Stanford NER training?如何在斯坦福 NER 训练中使用 pos 标签作为特征?
【发布时间】:2017-11-17 14:45:12
【问题描述】:

我正在尝试使用 useTags 和相关功能来训练斯坦福 NER CRF 模型。但是,尽管我在 .prop 文件中指定了我将使用此功能,但 CoreAnnotations.PartOfSpeechAnnotation.class 似乎没有返回任何内容,因此培训根本没有使用此功能。是不是我做错了什么没有使用这个功能?谢谢!

【问题讨论】:

    标签: nlp stanford-nlp named-entity-recognition


    【解决方案1】:

    您需要指定训练/测试数据中的哪一列具有 pos 标签并将 pos 标签添加到 CoNLL。

    您在这部分属性中指定该列:

    map = word=0,answer=1,tag=2

    (例如,如果您在第 3 列中添加了标签)

    【讨论】:

    • 一个后续问题:那么在我用这种格式的数据训练一个分类器之后,我如何将句子上的分类器称为字符串?我是否需要将该句子转换为带有标签的格式,或者有什么方法可以在我进行分类时自动标记该句子并使用标签作为特征?
    • 如果您运行 StanfordCoreNLP 管道,它应该使用管道标记句子的 POS 标签序列。命令行信息:stanfordnlp.github.io/CoreNLP/cmdline.html ... NER 注释器信息:stanfordnlp.github.io/CoreNLP/ner.html ... 请注意,您需要为新 ner 模型提供如下选项:“-ner.model /path/to/new_model.ser。 gz"
    • 非常感谢!我在 java 程序中调用 API。那么我可以将属性设置为包含 pos,然后设置 ner.model 吗?然后当我调用 pipeline.annotate(document) 时,pos 标签是否会作为 ner.model 的功能?
    • 是的,我相信。
    猜你喜欢
    • 2017-11-27
    • 2023-03-22
    • 1970-01-01
    • 1970-01-01
    • 2015-06-29
    • 1970-01-01
    • 1970-01-01
    • 2015-09-11
    • 1970-01-01
    相关资源
    最近更新 更多