【发布时间】:2018-01-31 09:19:30
【问题描述】:
如果我在 Google Cloud ML Engine 作业中使用 --scale-tier BASIC GPU,如何查看 GPU 利用率?我可以在“作业详细信息”选项卡上查看 CPU 利用率和内存利用率,但我想知道 GPU 的利用率。这只是包含在 CPU 使用率中,还是有另一个选项卡可以查看 GPU 使用率?
此外,有什么方法可以查看哪些操作占用了大部分 CPU 使用率?我的 CPU 利用率非常高,我的内存非常低,我的输入生成器总是满的(100%),所以我试图更好地了解时间花在哪里,以便我可以尝试优化我的模型性能.
【问题讨论】:
-
您可以查看gcloud ml-engine local 以在本地实例上运行您的训练以在那里进行分析(可能使用数据的子集),这比 ml-engine 更适合配置文件。
-
关于如何进行分析的任何建议?有博文或相关资源吗?
标签: tensorflow google-cloud-platform google-cloud-ml-engine