【问题标题】:Creating corpora for a tribal language POS tagging为部落语言词性标注创建语料库
【发布时间】:2019-02-20 09:23:30
【问题描述】:

我正在使用 NLTK 从文本字符串中提取名词,并且它的每个单词都已经在 (ibaloi) 语言中包含 POS 标签,这些标签稍后将用于创建语法:

sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))

英文没有问题。 有没有办法让它在部落(ibaloi)语言中也能工作?

(我是自然语言处理的新手,正在学习一些教程,顺便提一下。)

【问题讨论】:

    标签: python nlp nltk corpus


    【解决方案1】:

    您可能需要参考this 类似的问题,其中 OP 也有一个单词列表,其中包含 Excel 文件中的单词和词性(名词、动词等),用于非 NLTK 中的语言。

    【讨论】:

      猜你喜欢
      • 2015-02-20
      • 1970-01-01
      • 2019-02-01
      • 1970-01-01
      • 1970-01-01
      • 2020-01-18
      • 2013-05-14
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多