【发布时间】:2015-04-21 14:14:02
【问题描述】:
我在 R 中使用随机森林包进行回归,它给了我两种信息:Mean of squared residuals 和 % Var 解释。但是我想计算训练集和测试集的RMSE 和R^2,谁能帮我找到这些信息?
【问题讨论】:
-
请提供您的代码的最小可重现示例,其中包含库依赖项和您使用的任何函数。
标签: r random-forest mse
我在 R 中使用随机森林包进行回归,它给了我两种信息:Mean of squared residuals 和 % Var 解释。但是我想计算训练集和测试集的RMSE 和R^2,谁能帮我找到这些信息?
【问题讨论】:
标签: r random-forest mse
对不起,这不是一个具体的答案,但我没有足够的信誉发表评论。
如果没有可重复的例子,很难说你如何得到你想要的。但是,如果您在对randomForest 的调用中使用了xtest= 和ytest= 参数(假设您使用的是“randomForest”包),那么您要查找的内容应该是生成的randomForest 对象的一部分。您要查看的是生成的随机森林列表中的 test 部分。
一个尝试的例子:
rf.results <- randomForest( whatever arguments )
rf.results$test$mse # mse (maybe you can take the square root to get rmse)
rf.results$test$rsq # pseudo-R2 for random forest
如果您加载了随机森林包,您可以验证此信息并使用?randomForest 自己进行一些探索。文档的“值”部分详细说明了调用 randomForest 产生的对象以及您可以在哪里找到各种性能指标。
【讨论】:
rf.results$mse 将为您提供训练集的 mse,rf.results$rsq 将为您提供训练集的伪 R2。 rf.results$test 中的 mse 和 rsq 是验证集的性能度量。您应该使用这些来找到森林中的最佳树木数量。获得结果向量的原因是ntree 参数。您将获得由 1 到 ntree 棵树组成的随机森林的性能度量。