【问题标题】:Applying SpaCy's EntityRecognizer to a column within a Pandas dataframe将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列
【发布时间】:2018-07-19 22:39:51
【问题描述】:

我有一个基于文本的数据集,我希望将 SpaCy 的 EntityRecognizer 应用于特定列的每一行。

我可以通过执行以下操作来应用一般 spaCy 管道:

df['new_col'] = df['col'].apply(lambda x: nlp(x))

如何仅应用实体识别器并获取其值?

【问题讨论】:

    标签: python pandas dataframe nlp spacy


    【解决方案1】:

    在 Spacy 中,文档有一个属性 .ents,它会在其命名实体上返回一个生成器。

    所以你可以使用:

    df['new_col'] = df['col'].apply(lambda x: list(nlp(x).ents))
    

    【讨论】:

    • 这行得通。有没有办法调用该实体的 _label 并将其添加为附加列?
    • 我猜你可以做到以下几点:df['new_col'] = df['col'].apply(lambda x: list(nlp(x).label_))
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-09-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-10-31
    相关资源
    最近更新 更多