【问题标题】:NLTK (or other) Part of speech tagger that returns n-best tag sequencesNLTK(或其他)返回 n 最佳标签序列的词性标注器
【发布时间】:2017-08-28 10:00:23
【问题描述】:

我需要一个词性标注器,它不仅返回给定句子的最佳标签序列,而且返回 n 最佳标签序列。因此,对于“时间像箭头一样飞逝”,它可以返回 NN VBZ IN DT NN 和 NN NNS VBP DT NN 例如,按照概率排序。我需要使用我自己的标签集和句子示例来训练标注器,并且我想要一个允许设计句子的不同特征的标注器。如果其中一个 nltk 标记器具有此功能,那就太好了,但是任何可以与我的 Python 代码交互的标记器都可以。提前感谢您的任何建议。

【问题讨论】:

    标签: nltk pos-tagger


    【解决方案1】:

    我建议您查看spaCy。据我所见,默认情况下它不允许您返回前 n 个标签,但它支持creating custom pipeline components

    Github 上还有一个issue 专门讨论了这一点,并且有一些关于如何相对快速地实施它的建议。

    【讨论】:

      猜你喜欢
      • 2015-02-20
      • 1970-01-01
      • 1970-01-01
      • 2015-11-13
      • 2015-08-29
      • 1970-01-01
      相关资源
      最近更新 更多