【发布时间】:2021-12-27 06:45:36
【问题描述】:
我正在使用 spacy 构建自定义 NER,以识别除了 spacy 的 NER 之外的新实体。现在我可以使用 spacy.Example 标记和添加我的训练数据。我正在使用 BILOU 方案。我怀疑我有超过 3 个单词的实体。例如:
Housing Development Finance Corporation reported heavy losses in the past quarter.
我想使用 BILOU 方案将 Housing Development Finance Corporation 标记为单一实体。类似的东西
'Housing' B-Entity
'Development' I-Entity
'Finance' I-Entity
'Corporation' L-Entity
此标记是否正确?模型将如何解释每个实体中的顺序?任何指导将不胜感激。
【问题讨论】:
-
您可能想查看一些 BILOU 格式的示例数据,以了解事物的外观。特别是不应引用单词,并且每个单词 - 不仅仅是实体 - 都需要一个标签。
标签: python nlp named-entity-recognition spacy-3