GridSearchCV 及其特征重要性

【问题标题】：GridSearchCV and its feature importanceGridSearchCV 及其特征重要性
【发布时间】：2019-08-08 20:05:57
【问题描述】：

在gridsearchCV中，当我适合如下：

forest_reg = RandomForestRegressor()
grid_search = GridSearchCV(forest_reg, param_grid,cv=5,scoring = 'neg_mean_squared_error')
grid_search.fit(X_train,y_train)

然后，当我执行此操作时，

GridSearch.best_estimator_.feature_importances_

它给出了一个值数组所以我的问题是GridSearch.best_estimator_.feature_importances_ 这一行返回什么值？

【问题讨论】：

请优化您问题的格式
欢迎来到 SO；请花一分钟时间学习如何正确格式化您的代码
是的..！从现在开始我会这样做..对不起上面..:)

标签： machine-learning scikit-learn gridsearchcv

【解决方案1】：

在您的情况下，GridSearch.best_estimator_.feature_importances_ 返回一个 RandomForestRegressor 对象。

因此，根据RandomForestRegressordocumentation：

feature_importances_：形状数组 = [n_features] 返回特征重要性（越高，特征越重要）。

换句话说，它会根据您的训练集X_train 返回最重要的特征。 feature_importances_ 的每个元素对应X_train 的一个特征（例如：feature_importances_ 的第一个元素指的是X_train 的第一个特征/列）。

feature_importances_ 中元素的值越高，X_train 中的特征越重要。

【讨论】：

是的。但我想知道的是 feature_importances 返回的这些值到底是什么？我的意思是这些值的计算依据是什么？