【发布时间】:2020-04-15 23:22:01
【问题描述】:
我正在使用的 Sklearn 管道有多个转换器,但其中一个初始转换器返回 数字类型,而连续的一个则采用 对象类型 变量。
基本上我需要挤一个:
data[col] = data[col].astype(object)
用于管道中所需的列。
有什么办法吗?
注意:我正在使用Feature-engine 转换器。
【问题讨论】:
-
如果我没记错的话,从 1.1.0 版本开始,Feature-engine 的分类编码器现在采用参数 ignore_format=False,它允许将编码应用于非对象类型的变量。因此,这可能会简化您的管道,因为现在您不再需要重新转换变量。
-
另外,如果返回数值变量的transformer是CategoricalImputer,可以设置参数object=True,直接返回object。
标签: machine-learning scikit-learn sklearn-pandas