【问题标题】:GridSearchCV and its feature importanceGridSearchCV 及其特征重要性
【发布时间】:2019-08-08 20:05:57
【问题描述】:

在gridsearchCV中,当我适合如下:

forest_reg = RandomForestRegressor()
grid_search = GridSearchCV(forest_reg, param_grid,cv=5,scoring = 'neg_mean_squared_error')
grid_search.fit(X_train,y_train)

然后, 当我执行此操作时,

GridSearch.best_estimator_.feature_importances_ 

它给出了一个值数组 所以我的问题是GridSearch.best_estimator_.feature_importances_ 这一行返回什么值?

【问题讨论】:

  • 请优化您问题的格式
  • 欢迎来到 SO;请花一分钟时间学习如何正确格式化您的代码
  • 是的..!从现在开始我会这样做..对不起上面..:)

标签: machine-learning scikit-learn gridsearchcv


【解决方案1】:

在您的情况下,GridSearch.best_estimator_.feature_importances_ 返回一个 RandomForestRegressor 对象。

因此,根据RandomForestRegressordocumentation

feature_importances_:形状数组 = [n_features] 返回特征重要性(越高,特征越重要)。

换句话说,它会根据您的训练集X_train 返回最重要的特征。 feature_importances_ 的每个元素对应X_train 的一个特征(例如:feature_importances_ 的第一个元素指的是X_train 的第一个特征/列)。

feature_importances_ 中元素的值越高,X_train 中的特征越重要。

【讨论】:

  • 是的。但我想知道的是 feature_importances 返回的这些值到底是什么?我的意思是这些值的计算依据是什么?
猜你喜欢
  • 2018-06-30
  • 2018-12-14
  • 2021-12-23
  • 2022-06-20
  • 2021-11-07
  • 2019-02-28
  • 2021-02-03
  • 2016-11-07
  • 1970-01-01
相关资源
最近更新 更多