【发布时间】:2016-11-10 08:35:31
【问题描述】:
我在同一个文件夹中的cats.txt 中列出了一堆文件和类别。我想为此创建一个CategorizedTaggedCorpusReader。
这就是我的文件的样子。
在 nltk 中尝试了多种方法,但未能创建 Categorizedtaggedcorpusreader。在我的cats.txt 中,我有文件名和类别名称,其中空格分开,每个文件名可以有多个类别。
例如:
mail_1_adapter adapter
mail_1_alert alert
messagebody_24862499 others
etc.
你能告诉我一个更好的方法来创建我的语料库并利用它吗?
【问题讨论】:
标签: python-3.x nlp nltk corpus tagged-corpus