【发布时间】:2019-01-06 21:35:05
【问题描述】:
目前,我可以训练 NER 模型来识别位置、人员、组织的自定义值,但是如何训练 NER 模型来识别其他实体,例如技能、证明、车辆..等。
【问题讨论】:
标签: nlp stanford-nlp
目前,我可以训练 NER 模型来识别位置、人员、组织的自定义值,但是如何训练 NER 模型来识别其他实体,例如技能、证明、车辆..等。
【问题讨论】:
标签: nlp stanford-nlp
请看斯坦福NER简介:https://nlp.stanford.edu/software/CRF-NER.html
培训描述如下: https://nlp.stanford.edu/software/crf-faq.html#a
基本上,您必须使用带标签的文本创建训练数据。格式是制表符分隔的文件(.tsv 文件)。 像这样的:
This O
is O
a O
Mercedes VEHICLE
.
您将需要大量数据,并且可能必须手动对其进行注释。有一些像 dataturks.com 这样的工具可以帮助你。
【讨论】:
NERFeatureFactory的更多功能