【发布时间】:2016-05-05 07:10:46
【问题描述】:
我正在使用 mxnet 来训练一个 11 类图像分类器。我观察到一个奇怪的行为训练准确率正在缓慢增加并上升到 39%,在下一个 epoch 下降到 9%,然后在其余的训练中保持接近 9%。 我使用保存的模型(训练精度为 39%)重新开始训练,保持所有其他参数相同。现在训练准确性再次提高。这可能是什么原因?我无法理解它。而且以这种方式训练模型变得越来越困难,因为它需要我不断地查看训练准确度值。
学习率恒定在 0.01
【问题讨论】:
-
很可能是你的学习率太高,模型跳来跳去。不知道你的超参数很难分辨
-
学习率在 0.01
-
有一次我遇到了类似的问题,我偶然设置了一个线性激活并使用分类交叉熵作为成本函数。
标签: neural-network deep-learning mxnet