【发布时间】:2020-09-25 23:29:00
【问题描述】:
假设我有一个包含大量数字特征的数据集。我不确定在模型中使用数值特征的最佳方法是什么,因此我决定对它们应用不同的转换并将这些结果添加到数据集中。这些转换可以是 MinMax Scaling、StandardScaling、LogTransform,......任何你能想到的。
所以基本上,在原始数据中,我可能只有“Value_in_Dollars”特征,经过所有转换后,我还希望在数据集中拥有转换后的特征:
"Value_in_Dollars_MinMax", "Value_in_Dollars_SS", "Value_in_Dollars_Log"
除了原来的列。
我知道如何手动执行此操作,但如何在 Sklearn 管道中执行此操作?这甚至可能吗?
【问题讨论】:
-
您可以尝试使用“named_steps”的输出,并以您喜欢的方式将转换后的值添加到数据集
标签: python scikit-learn pipeline