【发布时间】:2019-02-09 18:54:21
【问题描述】:
我遇到了一个奇怪的错误
Error in `[.data.frame`(data, , lvls[1]) : undefined columns selected
当我使用插入符号训练 glmnet 模型时的消息。我对序数模型使用了基本相同的代码和相同的预测变量(只是使用了不同的因子ythen)并且效果很好。计算需要 400 个核心小时,所以我不能在这里展示)。
#Source a small subset of data
source("https://gist.githubusercontent.com/FredrikKarlssonSpeech/ebd9fccf1de6789a3f529cafc496a90c/raw/efc130e41c7d01d972d1c69e59bf8f5f5fea58fa/voice.R")
trainIndex <- createDataPartition(notna$RC, p = .75,
list = FALSE,
times = 1)
training <- notna[ trainIndex[,1],] %>%
select(RC,FCoM_envel:ATrPS_freq,`Jitter->F0_abs_dif`:RPDE)
testing <- notna[-trainIndex[,1],] %>%
select(RC,FCoM_envel:ATrPS_freq,`Jitter->F0_abs_dif`:RPDE)
fitControl <- trainControl(## 10-fold CV
method = "CV",
number = 10,
allowParallel=TRUE,
savePredictions="final",
summaryFunction=twoClassSummary)
vtCVFit <- train(x=training[-1],y=training[,"RC"],
method = "glmnet",
trControl = fitControl,
preProcess=c("center", "scale"),
metric="Kappa"
)
我找不到任何明显的数据错误。没有 NA
table(is.na(training))
FALSE
43166
并且不明白为什么它会尝试在列数之外建立索引。
有什么建议吗?
【问题讨论】:
-
我已将您的标签
caret更改为r-caret。由于您的问题的解决方案相当简单,我相信只要您使用正确的标签,您就可以更快地获得它。
标签: r r-caret training-data glmnet