【问题标题】:No output when running TensorFlow code on Cloud Machine Learning Engine在 Cloud Machine Learning Engine 上运行 TensorFlow 代码时没有输出
【发布时间】:2018-05-14 23:39:30
【问题描述】:

当我在终端中运行以下命令时:

$MODEL_DIR=output
gcloud ml-engine local train     --module-name trainer.task     --package-path trainer/     --job-dir $MODEL_DIR

它运行成功,但我在输出文件夹中没有得到任何东西。虽然根据这个我应该看到一些文件和检查点:https://cloud.google.com/ml-engine/docs/tensorflow/getting-started-training-prediction

在代码中我有这一行来保存我的模型:

save_path = saver.save(sess, "./my_mnist_model.ckpt")

这会在活动目录中生成以下文件:my_mnist_model.ckpt.indexmy_mnist_model.ckpt.metamy_mnist_model.ckpt.data-00000-of-00001

但是它们不在output 文件夹中。当我在 Cloud Machine Learning Engine 上运行它时,我的存储桶中的指定输出文件夹中也没有任何内容。

所以模型训练成功,但没有保存在任何地方。

我的代码/gcloud 命令中缺少什么?

【问题讨论】:

    标签: tensorflow google-cloud-ml


    【解决方案1】:

    刚刚发现自己需要在脚本中自己处理 --job-dir 。从入门手册中,我认为它是由运行训练的 gcloud 命令处理的。

    【讨论】:

    • 当您指定将模型保存在代码中的位置时,您正在为本地执行执行此操作。如果您想将模型部署到 Google Cloud Platform,则无需在代码中指定任何输出文件夹,因为您将通过将其作为 job-dir 参数传递来指定输出。您可以查看 Google Cloud 入门示例的 trainer 文件夹中的 task.py 文件,以了解 job-dir 参数被解析为输入,然后用于指定输出的模型目录。
    • 这似乎与适用于@user912830823 的解决方案直接冲突。那么,它是什么?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-09-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多