【发布时间】:2020-11-27 16:43:17
【问题描述】:
我有一个像这样的 numpy 数组,
A = np.random.randn(100, )
A.ravel()[np.random.choice(A.size, 10, replace=False)] = np.nan
np.nan 指示的值很少
我正在尝试在其上安装 KBinsDiscretizer。我想正常地对非空值进行 bin 并将空值标记为单独的 bin。
在尝试正常拟合 KBinsDiscretizer 时,由于数据中存在 np.nan,我收到以下错误。
est = KBinsDiscretizer(n_bins=5, encode='ordinal', strategy='quantile')
est.fit(A.reshape(-1, 1))
ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。
有什么解决办法吗?我想正常地对非空值进行分箱,并为空值创建一个额外的分箱。
【问题讨论】:
标签: python machine-learning scikit-learn