【发布时间】:2017-03-01 21:27:33
【问题描述】:
对于下面的二元分类问题,如果我在训练中使用“准确度”作为指标并使用 ROCR 包找到 AUC 分数,这将是多么合乎逻辑?或者我应该始终使用“ROC”作为计算 AUC 分数的指标吗?数据集不平衡。
control <- trainControl(method="cv", number=5)
fit <- train(diabetes~., data=PimaIndiansDiabetes, method="gbm", metric="Accuracy", trControl=control)
【问题讨论】:
-
准确性受到不平衡数据的影响,您可能希望使用不受类别平衡影响的任何指标。
ROCR是一个很好的计算度量的包,你想要曲线(ROC)还是曲线下的面积(AUROC)? -
是的,我想要曲线 (ROC) 或曲线下的面积 (AUROC)。
标签: r machine-learning classification data-mining