【发布时间】:2018-02-15 20:14:32
【问题描述】:
我想在云端运行模型训练。我正在关注this link,它运行示例代码来训练基于花卉数据集的模型。本教程由 4 个阶段组成:
- 设置您的 Cloud Storage 存储分区
- 在云端预处理训练和评估数据
- 在云端运行模型训练
- 部署和使用模型进行预测
我能够完成第 1 步和第 2 步,但是在第 3 步中,作业已成功提交,但发生了某种错误,并且任务以非退出状态 1 退出。这是任务的日志
扩展日志的截图是:
我使用了以下命令:
gcloud ml-engine jobs submit training test${JOB_ID} \
--stream-logs \
--module-name trainer.task \
--package-path trainer\
--staging-bucket ${BUCKET_NAME} \
--region us-central1 \
--runtime-version=1.2 \
-- \
--output_path "${GCS_PATH}/training" \
--eval_data_paths "${GCS_PATH}/preproc/eval*" \
--train_data_paths "${GCS_PATH}/preproc/train*"
提前致谢!
【问题讨论】:
标签: machine-learning google-cloud-ml