【问题标题】:Tensorflow GPU UsageTensorFlow GPU 使用情况
【发布时间】:2018-09-10 12:50:58
【问题描述】:

因此,我正在尝试在 Keras 中训练我的第一个图像分类器,它正在以 8000 张图像的训练集快速运行。在训练期间,我的 cpu / gpu 的使用率约为 40% / 3%,我完全不相信 tensorflow-gpu 安装正确,因为我没有得到我应该看到的“成功打开的 CUDA 库”行导入时。

我的问题是:

  1. 在 1080 上训练这种大小的东西通常需要多长时间,以及

  2. 鉴于我已经安装了以下内容,在尝试设置 tensorflow-gpu 时可能会缺少什么?

    • 全新安装 Windows 10
    • 最新的 64 位 Anaconda
    • 仅选中“使用 C++ 进行桌面开发”框的 Visual Studio 2017 安装时
    • 带有最新补丁的 Cuda Toolkit 9.0
    • cuDNN v7.0.5(2017 年 12 月 5 日),适用于 CUDA 9.0
    • tensorflow-gpu 1.7
    • 环境变量的屏幕截图

【问题讨论】:

  • 您描述的路径不是检查tf gpu使用情况的方式。提供一些代码和输出,以便我们为您提供帮助。您使用什么 IDE 以及在哪里检查使用情况,是否检查了 nvidia-smi.exe 并查看是否为您的环境分配了内存。安装后你测试了cudnn吗?

标签: python tensorflow machine-learning keras


【解决方案1】:

检查您的 tf 是否使用 GPU 的一种方法(对我来说也是最好的)是使用 nvidia-smi:在这里你可以看到我的任务的 GPU 内存使用情况(我有 160 万个观测值,包含 13 个变量并占用约 11 GB,你的也应该占用几 mb 或 GB(不知道你的图片看起来如何))所以如果你的系统不会显示一旦您开始运行模型,此信息肯定会使用 CPU(GPU 几分钟到几小时,但 CPU 需要更长的时间)

注意:我的终端不会输出 IDE 中存在的 tensorflow 输出内容,如下所示(CUDA 没有像网上声称的那样显示在那里,该 cuda 问题仅在不兼容且无法启动 GPU 时出现在 tf):

这是正确安装 cudnn 后测试通过的信息:

P.S:希望对您有所帮助。昨天在 ubuntu 中尝试了 Tensorflow 1.7 版本,但没有按预期工作(GPU 无法正常工作,因此降级回 1.6 )所以建议您使用 1.6:

因为您的设置与官方文档有点不同:

nvidia cuda toolkit documentation

所以这里是正确的路径:

确保设置了以下值:

Variable Name: CUDA_PATH 
Variable Value: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-10-15
    • 2020-07-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-03
    • 1970-01-01
    • 2022-01-03
    相关资源
    最近更新 更多