【发布时间】:2018-07-31 20:54:07
【问题描述】:
我有一个包含 15 个变量和 4669 个观察值的数据框。
我正在使用随机森林进行建模。我的数据集的目标是预测特定产品是否会被客户接受。
所以,我的输出变量有“是”、“否”和“”的因子。
我的问题是,我是否可以在随机 Forest 中预测这个 "" 为 Yes 或 No?
示例数据如下所示
Outputvar <- c("Yes", "Yes", "No", "NO", "", "")
Inputvar1 <- c("M", "F", "F", "M", "F", "M")
Inputvar2 <- c("34","25","40","50","60","34")
data <- data.frame(cbind(Outputvar,Inputvar2,Inputvar1))
我是 R 新手,如果我的理解是错误的,那么谁能解释我可以做什么?
编辑:这是我到目前为止尝试过的代码
library(RandomForest)
data$outvar <- factor(data$outputvar, exclude = NULL)
ind0 <- sample(2, nrow(data), replace = TRUE, prob = c(0.7,0.3))
train0 <- data[ind0==1, ]
test0 <- data[ind0==2, ]
fit1 <- randomForest(outputvar1~., data=train0)
print(fit1)
plot(fit1)
编辑2: 编号:3536 是:1061 “”:72
【问题讨论】:
-
你用的是什么包?到目前为止,您尝试了什么?
-
尝试添加:
data$Outputvar <- factor(data$Outputvar, exclude=NULL) -
@MrSmithGoesToWashington 我正在使用 Randomforest 包
-
@MrSmithGoesToWashington 实际上我的问题是,我是否可以使用随机森林将那些 Null 预测为是或否。 ??
-
小心,您的
data$Outputvar中有“否”和“否”类别。您应该更正此问题。
标签: r machine-learning random-forest