【发布时间】:2016-08-05 22:36:31
【问题描述】:
我有 3989 .txt 文件的文件。我使用 nltk 读取 txt 文件的 id 并将所有 id 放入文件中,现在我想读取每个 txt 文件并有两个输出,一个带有文本的语料库所有 txt 文件,其次是每个 txt 文件作为行的数组。但我什至无法读取文件,我有这个错误FileNotFoundError: [Errno 2] No such file or directory:。我怎样才能修复它并有我的两个输出?任何帮助表示赞赏!
这是我的代码:
from nltk.corpus import BracketParseCorpusReader
corpus_root = '/Users/sima/Downloads/Selected 20-newsgroupto work on/kole databaseha'
wordlists = PlaintextCorpusReader(corpus_root, '.*')
files = wordlists.fileids()
for file in files:
f = open(file,'r')
lines = f.read()
print(lines)
【问题讨论】:
标签: file python-3.x nltk text-mining path-finding