【问题标题】:Handling nan values with KBinsDiscretizer使用 KBinsDiscretizer 处理 nan 值
【发布时间】:2020-11-27 16:43:17
【问题描述】:

我有一个像这样的 numpy 数组,

A = np.random.randn(100, )
A.ravel()[np.random.choice(A.size, 10, replace=False)] = np.nan

np.nan 指示的值很少

我正在尝试在其上安装 KBinsDiscretizer。我想正常地对非空值进行 bin 并将空值标记为单独的 bin。

在尝试正常拟合 KBinsDiscretizer 时,由于数据中存在 np.nan,我收到以下错误。

est = KBinsDiscretizer(n_bins=5, encode='ordinal', strategy='quantile')
est.fit(A.reshape(-1, 1))

ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。

有什么解决办法吗?我想正常地对非空值进行分箱,并为空值创建一个额外的分箱。

【问题讨论】:

    标签: python machine-learning scikit-learn


    【解决方案1】:

    a PR to do this,在决定如何处理不同encode 值的NaN bin 时停滞不前;在此期间,您可以在本地使用/调整代码。

    【讨论】:

      猜你喜欢
      • 2020-12-05
      • 1970-01-01
      • 2019-05-11
      • 2014-02-14
      • 2018-08-22
      • 1970-01-01
      • 2023-01-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多