【问题标题】:Classification test set accuracy lower than validation分类测试集准确率低于验证
【发布时间】:2023-03-27 21:50:01
【问题描述】:

我的验证集具有很高的分类准确度。但是由于数据不平衡,因此测试数据很少。请在这里建议。

验证集准确率高但测试集准确率低的原因是什么?

【问题讨论】:

    标签: machine-learning classification training-data


    【解决方案1】:

    听起来您在测试集上过度拟合,但无法肯定地说,因为您的问题仅描述了您在做什么。你有什么样的问题?多标签,多类?或者更简单的东西?你如何衡量准确性?几节课?您使用哪个框架?

    仔细查看您的数据及其分布。如果它们不平衡,请在训练之前平衡它们。如果分布是 1:99,那么对两个类的网络进行普通训练是没有意义的。您必须通过重新平衡数据集(例如,通过对代表性不足的类进行过采样)或适当地修改损失函数来解决此问题。

    假设问题不是平衡而是overfitting,请使用data augmentationregularization。一些可能的尝试是减少模型容量(更少的参数)并添加类似dropout 和/或weight decay

    【讨论】:

      猜你喜欢
      • 2019-08-20
      • 2023-03-17
      • 2018-09-18
      • 2021-10-13
      • 2019-02-14
      • 2018-02-09
      • 2020-02-12
      • 1970-01-01
      • 2020-10-29
      相关资源
      最近更新 更多