【发布时间】:2014-05-10 21:20:50
【问题描述】:
我有下面的代码,我正在尝试将停用词列表应用于单词列表。然而,结果仍然显示诸如“a”和“the”之类的词,我认为这些词会被此过程删除。任何有问题的想法都会很棒。
import nltk
from nltk.corpus import stopwords
word_list = open("xxx.y.txt", "r")
filtered_words = [w for w in word_list if not w in stopwords.words('english')]
print filtered_words
【问题讨论】:
标签: python nltk stop-words