【发布时间】:2018-05-26 00:32:28
【问题描述】:
我只想保留作为停用词传递给 countvectorizer 的单词。
CV= CountVectorizer(max_features=500,stop_words= frozenset(["word1", "word2","word3"]))
如何做到这一点。
【问题讨论】:
标签: scikit-learn nlp
我只想保留作为停用词传递给 countvectorizer 的单词。
CV= CountVectorizer(max_features=500,stop_words= frozenset(["word1", "word2","word3"]))
如何做到这一点。
【问题讨论】:
标签: scikit-learn nlp
IIUC 你想使用vocabulary parameter 而不是stop_words:
CV = CountVectorizer(max_features=500, vocabulary=["word1","word2","word3"])
【讨论】: