【发布时间】:2013-10-16 06:09:35
【问题描述】:
我想知道我们是否可以在sklearn.pipeline 中设置一个“可选”步骤。例如,对于分类问题,我可能想尝试一个 ExtraTreesClassifier 与 AND 而没有前面的 PCA 转换。在实践中,它可能是一个带有额外参数的管道,指定PCA 步骤的切换,以便我可以通过GridSearch 等对其进行优化。我在 sklearn 源代码中看不到这样的实现,但是有什么解决办法吗?
此外,由于管道中后续步骤的可能参数值可能取决于上一步中的参数(例如,ExtraTreesClassifier.max_features 的有效值取决于PCA.n_components),是否可以指定这样的条件依赖在sklearn.pipeline 和sklearn.grid_search?
谢谢!
【问题讨论】:
标签: python machine-learning scikit-learn pipeline