【发布时间】:2018-12-22 08:58:13
【问题描述】:
我有一个数据框(宏),由一个因变量 (y) 和 19 个自变量或特征 (x) 组成。我想使用随机森林算法使用同一时期的 x 值预测最新的 y 变量(以蓝色突出显示)。
Macro <- read.csv("Input.csv")
x <- Macro[1:13,3:21] #training data
y <- Macro[1:13,2:2] #dependent variable
t <- Macro[14:14,2:21] #period I'd like to predict
rf <- randomForest(x,
y,
ntree=500,
importance=T)
predict(rf ,t)
上面返回一个值,但我有一种非常强烈的感觉,我错误地接近随机森林并且没有真正使用正确的程序或代码。感谢您的帮助。
【问题讨论】:
-
如果你想在
R中获得关于随机森林的非常好的教程,Introduction to Statistical Learning with Applications in R 是免费提供的,第 8 章介绍了基于树的方法,包括使用 @ 中的randomForest包987654327@. -
这不是一个格式正确的 SO 问题,但值得粗略的结构是正确的。您在
x和y上训练randomForest,然后在新数据上使用predict。您目前正在将您的森林保存为rf并预测cross.sell.rf,因此显然有一些代码您没有向我们展示。 -
更正了 SO 问题
标签: r machine-learning random-forest