【发布时间】:2017-01-12 09:39:27
【问题描述】:
我一直在使用单个 GTX Titan 训练我的 tensorflow 再训练算法,它工作得很好,但是当我尝试在再训练示例中使用多个 GPU 时,它不起作用,并且在我运行时似乎只使用一个 GPU它在 Nvidia SMI 中。
为什么会发生这种情况,因为它在从头开始重新训练 Inception 模型时可以使用多个 GPU,但在重新训练期间却不行?
【问题讨论】:
标签: tensorflow
我一直在使用单个 GTX Titan 训练我的 tensorflow 再训练算法,它工作得很好,但是当我尝试在再训练示例中使用多个 GPU 时,它不起作用,并且在我运行时似乎只使用一个 GPU它在 Nvidia SMI 中。
为什么会发生这种情况,因为它在从头开始重新训练 Inception 模型时可以使用多个 GPU,但在重新训练期间却不行?
【问题讨论】:
标签: tensorflow
TensorFlow 的花再训练示例根本不适用于多个 GPU,即使您将 --num_gpus > 1 设置为。如您所述,它应该支持单个 GPU。
需要修改模型以并行使用多个 GPU。不幸的是,像花再训练示例这样的单个 TensorFlow 操作目前无法自动拆分到多个 GPU 上。
【讨论】: