【问题标题】:random forest package in RR中的随机森林包
【发布时间】:2015-04-21 14:14:02
【问题描述】:

我在 R 中使用随机森林包进行回归,它给了我两种信息:Mean of squared residuals 和 % Var 解释。但是我想计算训练集和测试集的RMSER^2,谁能帮我找到这些信息?

【问题讨论】:

  • 请提供您的代码的最小可重现示例,其中包含库依赖项和您使用的任何函数。

标签: r random-forest mse


【解决方案1】:

对不起,这不是一个具体的答案,但我没有足够的信誉发表评论。

如果没有可重复的例子,很难说你如何得到你想要的。但是,如果您在对randomForest 的调用中使用了xtest=ytest= 参数(假设您使用的是“randomForest”包),那么您要查找的内容应该是生成的randomForest 对象的一部分。您要查看的是生成的随机森林列表中的 test 部分。

一个尝试的例子:

rf.results <- randomForest( whatever arguments )
rf.results$test$mse  # mse (maybe you can take the square root to get rmse)
rf.results$test$rsq  # pseudo-R2 for random forest

如果您加载了随机森林包,您可以验证此信息并使用?randomForest 自己进行一些探索。文档的“值”部分详细说明了调用 randomForest 产生的对象以及您可以在哪里找到各种性能指标。

【讨论】:

  • 谢谢,还有两个问题:1:用rf.results$mse,我可以计算训练集的mse和rsq吗?第二个问题,为什么我得到一个向量作为结果!!!?事实上,我只需要一个真正的 mse 和 rsq。但我认为,它为每个数据样本提供了一个 mse 和一个 rsq。我该怎么办?
  • rf.results$mse 将为您提供训练集的 mse,rf.results$rsq 将为您提供训练集的伪 R2。 rf.results$test 中的 mse 和 rsq 是验证集的性能度量。您应该使用这些来找到森林中的最佳树木数量。获得结果向量的原因是ntree 参数。您将获得由 1 到 ntree 棵树组成的随机森林的性能度量。
猜你喜欢
  • 1970-01-01
  • 2019-05-04
  • 2018-01-18
  • 2015-10-19
  • 2020-02-25
  • 1970-01-01
  • 1970-01-01
  • 2015-09-05
  • 2021-10-12
相关资源
最近更新 更多