【问题标题】:POS tagging in spanish with NLTK?用 NLTK 用西班牙语标记 POS?
【发布时间】:2014-09-22 10:49:28
【问题描述】:

我是 NLTK 库的新手,我想知道是否可以使用 NLTK 使用西班牙语语料库制作 POS 标记任务。在网上进行了一些研究,我找到了spaghetti-tagger,但它只有二元组和一元组标记器。是否可以使用 NLTK 对西班牙语语料库进行 POS 标记?

【问题讨论】:

  • 您还需要哪些其他机器学习方法/功能来训练您想要的西班牙语标注器?当我有空时,我可以尽力为spaghetti-tagger 添加新的算法/功能。顺便说一句,谢谢你查看意大利面条标签,我写的。

标签: python machine-learning nlp nltk


【解决方案1】:

您可以尝试使用 TnT 的原生 Python 实现或 Hunpos 的包装器:两者都应该可以正常工作。

但是,我开发了另一个名为 PurePos 的工具,它是用 JAVA 编写的,它也有一个 Python interface。有一个demo可以帮助你开始使用工具。

【讨论】:

  • 我应该用 pip 安装它吗?它是否支持西班牙语?。
  • 我建议从存储库下载 Python 包装器,然后您可以将其加入到项目中。 (它尚未发布。)它旨在独立于语言(非常类似于 TnT 或 HunPos)。您只需要一个带注释的语料库,然后您就可以开始训练该工具,并使用它进行标记。
  • 你有什么教程可以开始使用它吗?
猜你喜欢
  • 2013-01-21
  • 2017-04-15
  • 1970-01-01
  • 1970-01-01
  • 2014-06-14
  • 1970-01-01
  • 1970-01-01
  • 2013-12-18
  • 2014-12-05
相关资源
最近更新 更多