【发布时间】:2021-06-15 02:30:48
【问题描述】:
我正在使用 google colab 上的神经网络运行图像重建代码。我正在使用 GPU 加速器为模型训练 500 个 epoch,但前 446 个 epoch 每个 epoch 需要 12 秒才能运行,第 447 个 epoch 需要 864 秒,第 448 个 epoch 显示 ETA 超过 2 小时。运行时仍然是 GPU,有人可以解释为什么花费的时间增加了这么多吗? (请注意,在一次训练中,会话在第 447 个 epoch 时崩溃,说它用完了所有 RAM。
【问题讨论】: