【发布时间】:2017-11-10 09:35:50
【问题描述】:
在 SpacyV1 中,可以通过提供 BILOU 格式的文档和实体注释列表来训练 NER 模型。
然而,在 V2 中,似乎只有通过提供这样的实体注释(7、13、'LOC')才有可能进行训练,因此使用实体偏移和实体标签。
以 BILOU 格式提供令牌列表和另一个实体标签列表的旧方法是否仍然有效?
根据我从文档中收集到的信息,看起来 nlp.update 方法接受 GoldParse 对象列表,因此我可以为每个文档创建一个 GoldParse 对象并将 BILOU 标记传递给它的实体属性。但是,我会通过忽略 GoldParse 类的其他属性(例如头部或标签https://spacy.io/api/goldparse)来丢失重要信息,还是训练 NER 不需要其他属性?
谢谢!
【问题讨论】:
标签: nlp training-data named-entity-recognition spacy