【发布时间】:2012-05-09 12:58:45
【问题描述】:
我有以下代码(基于示例here),但它不起作用:
[...]
def my_analyzer(s):
return s.split()
my_vectorizer = CountVectorizer(analyzer=my_analyzer)
X_train = my_vectorizer.fit_transform(traindata)
ch2 = SelectKBest(chi2,k=1)
X_train = ch2.fit_transform(X_train,Y_train)
[...]
调用fit_transform时出现如下错误:
AttributeError: 'function' object has no attribute 'analyze'
根据文档,CountVectorizer 应该这样创建:vectorizer = CountVectorizer(tokenizer=my_tokenizer)。但是,如果我这样做,我会收到以下错误:"got an unexpected keyword argument 'tokenizer'"。
我实际的 scikit-learn 版本是 0.10。
【问题讨论】:
标签: python machine-learning scikits scikit-learn