【发布时间】:2013-05-01 05:55:11
【问题描述】:
您好,我正在使用以下 r 脚本构建随机森林:
# load the necessary libraries
library(randomForest)
testPP<-numeric()
# load the dataset
QdataTrain <- read.csv('train.csv',header = FALSE)
QdataTest <- read.csv('test.csv',header = FALSE)
QdataTrainX <- subset(QdataTrain,select=-V1)
QdataTrainY<-as.factor(QdataTrain$V1)
QdataTestX <- subset(QdataTest,select=-V1)
QdataTestY<-as.factor(QdataTest$V1)
mdl <- randomForest(QdataTrainX, QdataTrainY)
我在哪里得到以下错误:
Error in randomForest.default(QdataTrainX, QdataTrainY) :
NA not permitted in predictors
但是我的数据中没有出现 NA。
这里是我的数据供参考:
https://docs.google.com/file/d/0B0iDswLYaZ0zUFFsT01BYlRZU0E/edit
有谁知道为什么会抛出这个错误?在此期间,我会继续寻找。 提前感谢您的帮助!
【问题讨论】:
-
您是否尝试过调用建模函数的常用公式方法,即
randomForest(V1 ~ ., data=QdataTrain)?会不会出现同样的问题? -
也试试
traceback():运行你的脚本,当它失败时,输入traceback()作为下一个命令,看看是哪个子命令或函数抛出了这个错误。 -
我无法重现错误(我评论了所有测试相关数据)
-
确实有一些缺失值。我已经展示了找到它们的步骤。
标签: r random-forest