【发布时间】:2018-10-06 10:53:56
【问题描述】:
我已经尝试了堆栈溢出中所有可能的解决方案,建议数据和参考应该是具有相同水平的因素。
set.seed(10)
indices = sample.split(consumers$label, SplitRatio = 0.75)
train = consumers[indices,]
test = consumers[!(indices),]
##Build a logistic regression model
is.factor(train$label)
contrasts(train$label)
lr_model <- data.frame(label = as.numeric(rnorm(100)>0.5), b= rnorm(100), c = rnorm(100), d = rnorm(100))
logitMod <- glm(label ~ ., data=train, family=binomial(link="logit"))
pdata <- predict(logitMod, newdata = train, type = "response")
confusionMatrix(data = as.numeric(pdata>0.5), reference = train$label)
我仍然得到“错误:data 和 reference 应该是具有相同水平的因素。”
我的数据集有三列 - 口粮、时间和标签(标签是男性和女性)
【问题讨论】:
-
如果您使用的是 Roman 猜测的 library(caret),请添加 r-caret 标签。
标签: r logistic-regression confusion-matrix