【发布时间】:2019-06-28 02:26:14
【问题描述】:
感谢您为此提供的任何形式的想法或帮助。
我已经提交了一份包含波士顿住房数据的作业。
目标是使用 randomForest 进行预测。 要优化的量是 RMSE。
我对如何进行 RMSE 感到困惑。请大家帮忙
谢谢
我已经尝试遵循 RMSE 公式,并且我已经完成了基本的想法,但我没有取得任何进展。请指导
谢谢
raw.data <- read.csv("Boston Housing data.csv", header = T, sep = "")
fit1<-lm(raw.data$MEDV~.,data = raw.data)
RMSE<- sqrt(mean((raw.data-fit1)^2),na.strings="?")
Ops.data.frame(raw.data, fit1) 中的错误: 长度为 12 的列表没有意义
【问题讨论】:
-
非常通用的基本调试技巧。当一行中有错误时,运行该行的每一部分以查看其中的内容。使用您的线路,您可能会开始将其缩小到
mean((raw.data-fit1)^2),以查看问题是否出在sqrt()。你会得到同样的错误,所以你试试mean((raw.data-fit1)^2)。同样的错误,所以尝试raw.data-fit1,同样的错误,所以您查看raw.data并希望意识到它是整个数据框,这没有意义。然后将其更改为raw.data$MEDV-fit1。还是报错!然后看看fit1,发现它是一个模型,而不是一个数字向量...... -
要成功学习 R(或任何计算机语言),您可以培养的最重要技能是通过隔离问题并检查您对每一小段代码的假设进行调试。
-
是否有理由从头开始编写指标代码?
标签: r machine-learning random-forest