【发布时间】:2016-02-01 21:48:30
【问题描述】:
首先让我说我已经阅读了很多关于交叉验证的帖子,似乎那里有很多混乱。我的理解是这样的:
- 执行 k 折交叉验证(即 10 折)以了解 10 折的平均误差。
- 如果可以接受,则在完整数据集上训练模型。
我正在尝试在 R 中使用 rpart 并利用 caret 包来构建决策树。下面是我正在使用的代码。
# load libraries
library(caret)
library(rpart)
# define training control
train_control<- trainControl(method="cv", number=10)
# train the model
model<- train(resp~., data=mydat, trControl=train_control, method="rpart")
# make predictions
predictions<- predict(model,mydat)
# append predictions
mydat<- cbind(mydat,predictions)
# summarize results
confusionMatrix<- confusionMatrix(mydat$predictions,mydat$resp)
我有一个关于插入符号火车申请的问题。我已经阅读了A Short Introduction to the caret Package train 部分,其中指出在重采样过程中确定了“最佳参数集”。
在我的示例中,我是否正确编码?我需要在我的代码中定义rpart 参数还是我的代码足够?
【问题讨论】:
标签: r cross-validation r-caret rpart