【发布时间】:2020-02-17 01:56:27
【问题描述】:
[数据集] 作为一个新手,我尝试了泰坦尼克号的问题。正要使用数据集进行训练,这就是我卡住的地方:
all_model<-modelLookup()
classification_model<-all_model%>%filter(forClass==TRUE,!duplicated(model))
class_model<-classification_model$model
set.seed(123)
number<-3
repeats<-2
control<-trainControl(method="repeatedcv",number=number,repeats=repeats,classProbs = TRUE,savePredictions = "final",index=createResample(data_prepro_maf_train$Embarked,repeats*number),summaryFunction = multiClassSummary,allowParallel = TRUE)
x<-data_prepro_maf_train[,c(1,3,5,6,7,8)]
y<-data_prepro_maf_train[,12]
levels(y)<-make.names(levels(factor(data_prepro_maf_train[,12])))
y<-make.names(data_prepro_maf_train[,12],unique=TRUE,allow_=TRUE)
#Train the models
model_list1<-caretList(x,y,data=data_prepro_maf_train,trControl = control,metric="Accuracy",methodList = class_model[1])
我确保选择没有缺失值的列,例如“Cabin”,并且已经删除了所需列的缺失值。
使用的包:
library(caret)
library(caretEnsemble)
library(tidyverse)
library(magrittr)
library(doParallel)
【问题讨论】:
-
你能提供一个
dput(head(df,n))的数据样本吗? -
你好 NelsonGon。附上数据集的链接。
-
@Jabby 你能提供对象
all_model吗?您的问题中缺少它。所以,我无法继续前进。你加载了哪些库,也请出示一下? -
all_model
-
您正在使用
caret包中提供的所有分类模型。所以,训练需要时间。你可以看到this post