【发布时间】:2018-05-29 01:25:13
【问题描述】:
我正在尝试对神经网络进行建模以解决 CIFAR-10 数据集,但我面临一个非常奇怪的问题,我尝试了超过 6 种不同的 CNN 架构以及许多不同的 CNN 超参数和完全连接的#neurons 值,但似乎都失败了,损失为 2.302,相应的准确度为 0.0625,为什么会发生这种情况,CNN 或神经网络的什么属性导致了这种情况,我还尝试了 dropout、l2_norm、不同的内核大小、CNN 和 Max Pool 中的不同填充。我不明白为什么损失会停留在这么一个奇数上?
我正在使用 tensorflow 实现这一点,并且我尝试了 softmax 层 + cross_entropy_loss 和 without_softmax_layer + sparse_cross_entropy_loss。是不是神经网络损失函数卡在了高原?
【问题讨论】:
标签: tensorflow deep-learning artificial-intelligence conv-neural-network