【发布时间】:2016-12-18 09:58:01
【问题描述】:
我有一个包含 332 列的数据框。我想估算值以便能够使用 scikit-learn 的决策树分类器。我的问题是 imputer 函数结果数据的列只有 330。
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
cols = data.columns
new = imp.fit_transform(data)
print(data.shape,new.shape)
(34132, 332) (34132, 330)
【问题讨论】:
-
你有全 NaN 列吗?
-
是的。这就是我的回答。谢谢。
标签: python scikit-learn