【发布时间】:2019-01-10 23:28:05
【问题描述】:
我试图弄清楚如何通过我的回归模型来测试它与我的数据集的另一部分,这样我就可以开始我的困惑 matrix 但我不知道我做错了什么。
studentreport<-read.csv("C:\\Users\\Joseph\\Downloads\\studentreport dataset full imp.csv",header=T,sep=",")
studentreport<-data.frame(studentreport)
smp_size <- floor(0.75 * nrow(studentreport))
set.seed(123)
train_ind <- sample(seq_len(nrow(studentreport)), size = smp_size)
train <- studentreport[train_ind, ]
test <- studentreport[-train_ind, ]
fitreport<-glm(train)
Fitstart=glm(Enrolling~1,data=train)
Report<-step(Fitstart,direction="forward",scope=formula(fitreport))
predict(Report, newdata = test,type ="response")
当我这样做时,我得到了这个错误:
“model.frame.default 中的错误(条款,新数据,na.action = na.action, xlev = object$xlevels) : 因子状态有新的级别 AP"
【问题讨论】:
-
您好,问题很可能是您的数据框中有一个因子,并且该因子的所有级别都存在于测试数据集中。也可以在这里查看这个问题stackoverflow.com/questions/16493920/…
-
请用谷歌搜索“model.frame.default 新关卡中的错误”。这已被多次询问,错误说明了问题。该变量包含不属于模型已被训练的设计矩阵的一部分,因为它们不在训练数据集中,或者由于其他变量中的缺失值而导致观察被删除而被删除。
-
那么代码predict(Report, newdata=test, type response)是正确的写法吗?
标签: r regression logistic-regression predict confusion-matrix