【发布时间】:2016-08-26 12:03:14
【问题描述】:
我在 Python 中遵循了这个 Scikit-Learn example 从森林估计器获取 .feature_importances_。在该示例中,ExtraTreesClassifier() 与其默认值一起使用
超参数设置 - 这意味着max_features='auto'。此示例的输出是 10 个特征的重要性图。
问题 1:
当我使用max_features=2 重新运行此示例时,该图仍显示所有 10 个特征的特征重要性。是否应该只显示 2 个功能的重要性?
问题 2:
现在,我想将ExtraTreesClassifier(max_features=2) 与RFECV() 一起使用。从RFECV() docs 中,它表明RFECV() 将最佳特征分配为1 - 我们可以在RFECV() 的.ranking_ 属性中看到这一点。但是,如果我将估计器指定为 ExtraTreesClassifier(max_features=2),那么 RFECV() 在其估计器中使用 2 个特征并且只返回 2 个特征的排名吗?还是忽略max_features 并返回所有功能的排名?
【问题讨论】:
标签: python python-2.7 machine-learning scikit-learn