【发布时间】:2021-07-14 10:22:12
【问题描述】:
我的一个项目是使用 scikit-learn imputer 来处理 NaN 值,但是,它似乎删除了完全由 NaN 组成的行,如下面的 sn-p 所示:
tmp = [[math.nan, 3.0],[math.nan, 5.0],[math.nan, math.nan]]
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
imp_tmp = imp.fit_transform(np.asarray(tmp, dtype=np.float_))
print(np.asarray(tmp, dtype=np.float_))
print(np.asarray(imp_tmp, dtype=np.float_))
assert len(np.asarray(tmp, dtype=np.float_)[0]) == len(np.asarray(imp_tmp, dtype=np.float_)[0])
尤其是断言失败。有谁知道这种行为是否记录在案以及如何预防?我在文档中找不到有关删除 NaN 行的 imputer 的任何信息:Simple Imputer
【问题讨论】:
标签: python numpy scikit-learn imputation