【发布时间】:2021-05-09 13:09:37
【问题描述】:
我目前正在研究随机森林分类器。随机森林分类器的参数之一是“Criterion”,它有 2 个选项:Gini 或 Entropy。基尼值低是首选,熵值高是首选。默认情况下,gini 是随机森林分类器的标准。
sklearn 提供了一个名为feature_importances_ 的属性,我们在其中获取所提供的属性/特征的值。通过使用我们可以选择一些特征并使用“阈值和SelectFromModel”消除一些特征
我的疑问是,这些feature_importances_ 的计算依据是什么?假设默认标准“Gini”可用。如果我假设feature_importances_ 是“Gini Importances”,则首选低值,但在特征重要性方面,首选高值
【问题讨论】:
标签: scikit-learn random-forest