【问题标题】:Additional Named Entity Recognition models for Stanford CoreNLP?斯坦福 CoreNLP 的其他命名实体识别模型?
【发布时间】:2019-06-08 12:11:58
【问题描述】:

Stanford CoreNLP 库包含用于识别时间、位置、组织、人员、金钱、百分比和日期的模型。是否有其他团体提供的其他通用模型可以识别其他事物?

此外,如果我们要训练 a new model 以识别只是乐队名称(例如),我们是否可以在打包的模型之外运行我们的新模型,或者必须训练如果我们想这样做,新模型可以同时识别时间、位置、组织、人员、金钱、百分比、日期和范围?文档确实说现有模型本身不能扩展。

【问题讨论】:

    标签: nlp stanford-nlp


    【解决方案1】:

    您绝对可以训练 CRFClassifier 或 RegexNER 来识别乐队名称并将其与其他 NER 标记器结合起来,并且您的模块可以专门关注乐队名称。

    我可能会推荐使用 RegexNER 作为乐队名称。这是链接:

    http://nlp.stanford.edu/software/regexner/

    基本上,您只需使用乐队名称或与乐队名称匹配的正则表达式创建一个文件,然后您可以使用标准管道根据您的自定义工作来标记文本。

    这是一个示例命令:

    java -mx1g -cp "*:." edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators "tokenize,ssplit,pos,lemma,ner,regexner" -file sample_text.txt -regexner.mapping my-band-regexes.txt
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-03-17
      • 2012-11-25
      • 1970-01-01
      • 2019-01-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多