【发布时间】:2018-11-21 22:35:47
【问题描述】:
我在 R 中创建了一个预测模型。我想做特征选择。我已经读过 xgboost 不需要进行变量选择,但我为过去的 1、2、3、4 和 5 分数添加了一个变量。添加每个变量在 5 倍 5 重复交叉验证中给出这些 RMSE。
10.3 10.1 10 10.1 10.5
这表明,由于错误率产生的 U 模式,变量选择确实会产生影响。
我正在考虑遍历所有新变量,但这听起来效率低下。有没有更好的方法?
我也在考虑进行逐步回归并使用这些功能。这是个好主意吗?
【问题讨论】:
标签: r r-caret xgboost feature-selection