【问题标题】:POS tagging using brown tag set in NLTK使用 NLTK 中设置的棕色标签进行 POS 标记
【发布时间】:2016-10-12 00:54:29
【问题描述】:

是否可以使用 NLTK 中设置的棕色标签来分配标签?我没有使用已经标记的棕色语料库。

【问题讨论】:

标签: nltk


【解决方案1】:

是的,但不是开箱即用:您可以在布朗语料库上训练自己的标注器。性能将取决于您需要标记的文本类型,以及您在尝试不同类型的标记器时投入的工作量。 NLTK 书中的Chapter 5 将逐步引导您完成制作一个相当不错的标记器的过程(特别是查看N-Gram Tagging 部分),它甚至使用布朗语料库作为示例——你赢了不需要改变任何东西。

【讨论】:

  • 谢谢。我尝试使用棕色语料库训练 UnigramTagger
  • 这很好,但是 Unigram 标注器几乎没用:它只是通过最常见的 POS 标记每个单词。继续阅读,直到找到三元组标记器(尽管在二元组之后你的表现可能会变平)。
  • 如何训练标注器以使其有效?
  • NLTK 书的第 5 章将逐步引导您完成制作一个相当不错的标注器的过程。
猜你喜欢
  • 2014-12-02
  • 1970-01-01
  • 2016-07-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-07-07
  • 1970-01-01
  • 2012-11-26
相关资源
最近更新 更多