【问题标题】:Google Cloud ML Engine GPU Utilization谷歌云机器学习引擎 GPU 利用率
【发布时间】:2018-01-31 09:19:30
【问题描述】:

如果我在 Google Cloud ML Engine 作业中使用 --scale-tier BASIC GPU,如何查看 GPU 利用率?我可以在“作业详细信息”选项卡上查看 CPU 利用率和内存利用率,但我想知道 GPU 的利用率。这只是包含在 CPU 使用率中,还是有另一个选项卡可以查看 GPU 使用率?

此外,有什么方法可以查看哪些操作占用了大部分 CPU 使用率?我的 CPU 利用率非常高,我的内存非常低,我的输入生成器总是满的(100%),所以我试图更好地了解时间花在哪里,以便我可以尝试优化我的模型性能.

【问题讨论】:

  • 您可以查看gcloud ml-engine local 以在本地实例上运行您的训练以在那里进行分析(可能使用数据的子集),这比 ml-engine 更适合配置文件。
  • 关于如何进行分析的任何建议?有博文或相关资源吗?

标签: tensorflow google-cloud-platform google-cloud-ml-engine


【解决方案1】:

watch -n 0.5 nvidia-smi 可以在命令行中查看 NVIDIA GPU 使用情况。

【讨论】:

    【解决方案2】:

    目前无法通过 Cloud ML Engine 查看 GPU 利用率。

    TensorFlow 有一个称为时间线的功能,可用于获取配置文件数据。这是一个blog post 描述如何使用它。

    【讨论】:

    • 嗨,现在还是这样吗?或者现在有办法查看 GPU 利用率吗?谢谢
    • 仍然使用 GPU。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-02-14
    • 1970-01-01
    • 2018-06-09
    • 2018-09-23
    • 1970-01-01
    • 1970-01-01
    • 2019-01-13
    相关资源
    最近更新 更多