【发布时间】:2019-06-19 20:36:16
【问题描述】:
我运行了一段关于深度学习网络的代码,首先我训练了网络,效果很好,但是运行到验证网络时出现这个错误。
我有五个 epoch,每个 epoch 都有一个训练和验证的过程。我在第一个时期验证时遇到了错误。所以我不运行验证代码,我发现代码可以运行到第二个epoch并且没有错误。
我的代码:
for epoch in range(10,15): # epoch: 10~15
if(options["training"]["train"]):
trainer.epoch(model, epoch)
if(options["validation"]["validate"]):
#if(epoch == 14):
validator.epoch(model)
我觉得验证的代码可能有一些错误。但我找不到。
【问题讨论】:
-
那么你最终如何修复这个错误呢?你会减少批量大小吗?
-
@xiaoding,你能告诉我们,解决办法是什么?
-
@Lauraishere,他们在下面评论说他们减少了批量大小并且它不起作用。我也一样。你的问题解决了吗,如果解决了,可以分享一下吗?
-
如果模型用于验证,可以尝试使用'torch.no_grad()'。