【问题标题】:Tensorflow stuck for seconds at the end of every epochTensorflow 在每个 epoch 结束时卡住了几秒钟
【发布时间】:2021-03-26 07:55:21
【问题描述】:

我正在通过 TFRecordDataset 训练神经网络。但是,在每个 epoch 结束时,即使用ETA: 0s,训练会卡住数十秒。作为参考,在大约 25GB 的数据集上完成一个 epoch 大约需要一分钟(在解析特征子集之前)。

我正在使用 Nvidia Titan RTX GPU 运行 TensorFlow 2.3.1。这是预期的行为吗?也许是由于输入管道中的预处理?该预处理是仅由 CPU 执行还是卸载到 GPU 上?谢谢!

【问题讨论】:

  • 它对验证数据的计算预测和指标,不用担心

标签: python tensorflow keras dataset nvidia


【解决方案1】:

如果您有一个验证集并且您正在使用model.fit(),那么这可能是计算损失和指标所需的时间。在大多数情况下,计算 80/20 分割的指标需要额外的 25%。

【讨论】:

    猜你喜欢
    • 2018-07-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-28
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多