【问题标题】:Train NER model to recognize Custom entity训练 NER 模型以识别自定义实体
【发布时间】:2019-01-06 21:35:05
【问题描述】:

目前,我可以训练 NER 模型来识别位置、人员、组织的自定义值,但是如何训练 NER 模型来识别其他实体,例如技能、证明、车辆..等。

【问题讨论】:

    标签: nlp stanford-nlp


    【解决方案1】:

    请看斯坦福NER简介:https://nlp.stanford.edu/software/CRF-NER.html

    培训描述如下: https://nlp.stanford.edu/software/crf-faq.html#a

    基本上,您必须使用带标签的文本创建训练数据。格式是制表符分隔的文件(.tsv 文件)。 像这样的:

    This  O
    is    O
    a     O
    Mercedes    VEHICLE
    .
    

    您将需要大量数据,并且可能必须手动对其进行注释。有一些像 dataturks.com 这样的工具可以帮助你。

    【讨论】:

    • 我试过了,但被错误识别为 City 或 Person。
    • 那么你的训练数据可能太小了。另外,尝试使用NERFeatureFactory的更多功能
    • 所以,我必须用更多的训练数据进行训练,才能识别车辆、证明等新领域。那么如何确定模型已准备好识别新领域?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-01-02
    • 2020-08-30
    • 2015-05-24
    • 1970-01-01
    • 1970-01-01
    • 2014-04-05
    相关资源
    最近更新 更多