【发布时间】:2019-10-27 23:30:50
【问题描述】:
我正在训练一个 CNN 模型(使用 Keras 制作)。输入图像数据有大约 10200 张图像。有120个类别需要分类。绘制数据频率,我可以看到每个类的样本数据在分布方面或多或少是均匀的。
我面临的问题是训练数据的损失图随着时代的推移而下降,但对于验证数据,它首先下降然后继续增加。准确度图反映了这一点。训练数据的准确度最终稳定在 0.94,但验证数据的准确度在 0.08 左右。
基本上是过度拟合的情况。
我使用 0.005 的学习率和 0.25 的 dropout。
我可以采取哪些措施来提高验证的准确性?每个类的样本量是否可能太小,我可能需要数据扩充以获得更多数据点?
【问题讨论】: