分类测试集准确率低于验证答案

【问题标题】：Classification test set accuracy lower than validation分类测试集准确率低于验证
【发布时间】：2023-03-27 21:50:01
【问题描述】：

我的验证集具有很高的分类准确度。但是由于数据不平衡，因此测试数据很少。请在这里建议。

验证集准确率高但测试集准确率低的原因是什么？

【问题讨论】：

【解决方案1】：

听起来您在测试集上过度拟合，但无法肯定地说，因为您的问题仅描述了您在做什么。你有什么样的问题？多标签，多类？或者更简单的东西？你如何衡量准确性？几节课？您使用哪个框架？

仔细查看您的数据及其分布。如果它们不平衡，请在训练之前平衡它们。如果分布是 1:99，那么对两个类的网络进行普通训练是没有意义的。您必须通过重新平衡数据集（例如，通过对代表性不足的类进行过采样）或适当地修改损失函数来解决此问题。

假设问题不是平衡而是overfitting，请使用data augmentation 和regularization。一些可能的尝试是减少模型容量（更少的参数）并添加类似dropout 和/或weight decay。

【讨论】：