【发布时间】:2021-09-11 06:29:26
【问题描述】:
我有两个关于 scikit-learn OHE 方法的问题:
-
如果我们只是将数据重新整形为
(nrows,1),为什么一个热门编码器不接受一维数据,而它却能完美运行? -
(drop=first、binary 等)实际上做了什么,如果我们将值设置为 None 会发生什么?
【问题讨论】:
标签: python machine-learning scikit-learn
我有两个关于 scikit-learn OHE 方法的问题:
如果我们只是将数据重新整形为(nrows,1),为什么一个热门编码器不接受一维数据,而它却能完美运行?
(drop=first、binary 等)实际上做了什么,如果我们将值设置为 None 会发生什么?
【问题讨论】:
标签: python machine-learning scikit-learn
您可以阅读文档。
https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
无:保留所有功能(默认)。
‘first’:删除每个特征中的第一个类别。如果只存在一个类别,则该功能将被完全删除。
‘if_binary’ : 删除每个特征中的第一个类别,有两个类别。具有 1 个或超过 2 个类别的特征保持不变。
array : drop[i] 是特征 X[:, i] 中应该被删除的类别。
【讨论】: