【问题标题】:why is multi GPU tensorflow retraining not working为什么多 GPU tensorflow 重新训练不起作用
【发布时间】:2017-01-12 09:39:27
【问题描述】:

我一直在使用单个 GTX Titan 训练我的 tensorflow 再训练算法,它工作得很好,但是当我尝试在再训练示例中使用多个 GPU 时,它不起作用,并且在我运行时似乎只使用一个 GPU它在 Nvidia SMI 中。

为什么会发生这种情况,因为它在从头开始重新训练 Inception 模型时可以使用多个 GPU,但在重新训练期间却不行?

【问题讨论】:

    标签: tensorflow


    【解决方案1】:

    TensorFlow 的花再训练示例根本不适用于多个 GPU,即使您将 --num_gpus > 1 设置为。如您所述,它应该支持单个 GPU。

    需要修改模型以并行使用多个 GPU。不幸的是,像花再训练示例这样的单个 TensorFlow 操作目前无法自动拆分到多个 GPU 上。

    【讨论】:

    • 您能提供如何制作 GPU mp 的示例吗?
    • 不幸的是,这超出了 SO 评论/答案的范围,但是如果您访问 TensorFlow 多 GPU 基础教程并检查其源代码,则有一些很好的起点。
    猜你喜欢
    • 2017-09-10
    • 2017-03-30
    • 2016-10-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多