为部落语言词性标注创建语料库答案

【问题标题】：Creating corpora for a tribal language POS tagging为部落语言词性标注创建语料库
【发布时间】：2019-02-20 09:23:30
【问题描述】：

我正在使用 NLTK 从文本字符串中提取名词，并且它的每个单词都已经在 (ibaloi) 语言中包含 POS 标签，这些标签稍后将用于创建语法：

sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))

英文没有问题。 有没有办法让它在部落（ibaloi）语言中也能工作？

（我是自然语言处理的新手，正在学习一些教程，顺便提一下。）

【问题讨论】：

【解决方案1】：

您可能需要参考this 类似的问题，其中 OP 也有一个单词列表，其中包含 Excel 文件中的单词和词性（名词、动词等），用于非 NLTK 中的语言。

【讨论】：