【问题标题】:spaCy not picking up all ORG tags in sentencespaCy 没有在句子中提取所有 ORG 标签
【发布时间】:2026-01-31 11:35:01
【问题描述】:

我正在使用 spaCy 尝试在句子中提取 ORG 实体标签。但是,它并没有拾取所有标签,而且它拾取的标签因组织名称的书写方式而异。例如:

import spacy
from spacy import displacy

doc = nlp("Apple, Microsoft, Google, and Facebook are all techo companies from the USA")
displacy.render(doc, style='ent')    # I am using `.render` as I am in a notebook

产生: 这显然错过了Facebook

同时

import spacy
from spacy import displacy

doc = nlp("Apple, Microsoft Inc, Google, and Facebook are all techo companies from the USA")
displacy.render(doc, style='ent')

产生: 现在缺少GoogleFacebook

关于我做错了什么有什么想法吗?

【问题讨论】:

    标签: python spacy spacy-3


    【解决方案1】:

    您没有做错任何事,只是模型并不完美。请参阅 Github 上的 this issue,其中解释说这只是统计模型工作原理的一部分。

    请注意,您的示例在我最新的大型英文模型中似乎可以正常工作。

    【讨论】:

      最近更新 更多