【发布时间】:2019-10-11 15:16:18
【问题描述】:
我遇到了 Azure 机器学习服务中的数据集模块的问题。我用一堆图像创建了一个 FileDataset 来在 TensorFlow 中训练一个模型。我将数据集安装在目标计算中,然后将安装点传递给训练脚本,如in the sample notebook we have on GitHub 所述。
我尝试了两种方法:将路径作为脚本参数(如 GitHub 上的建议)和命名输入传递,但它们似乎都没有正确传递安装点。任何人都知道哪个是使它工作的正确方法? (顺便说一句,我可以让它与数据源一起工作)
作为脚本参数
script_params = {
'--data-folder': dset.as_named_input('dogscats_train').as_mount('tmp/dataset'),
}
src = TensorFlow(source_directory = r'Tensorflow',
framework_version = '1.13',
entry_script = 'train.py',
script_params=script_params,
compute_target='amlcompute',
vm_size='Standard_NC6',
use_gpu = True,
pip_packages = ['matplotlib', 'pillow', 'numpy', 'azureml-sdk'])
安装路径:
/mnt/batch/tasks/shared/LS_root/jobs/aa-ml-aml-workspace/azureml/cats-vs-dogs-tensorflow_1570799752_014bea9f/mounts/workspaceblobstore/azureml/cats-vs-dogs-tensorflow_1570799752_014bea9f/tmp/数据集
脚本中收到的实际路径:
/tmp/数据集
命名输入
src = TensorFlow(source_directory = r'Tensorflow',
framework_version = '1.13',
entry_script = 'train.py',
inputs=[dset.as_named_input('dogscats_train')],
compute_target='amlcompute',
vm_size='Standard_NC6',
use_gpu = True,
pip_packages = ['matplotlib', 'pillow', 'numpy', 'azureml-sdk'])
安装路径:
/mnt/batch/tasks/shared/LS_root/jobs/aa-ml-aml-workspace/azureml/cats-vs-dogs-tensorflow_1570804147_39168dcf/mounts/workspaceblobstore
run.input_datasets['dogscats_train'].mount('tmp/dataset').mount_point 检索到的路径:
/mnt/batch/tasks/shared/LS_root/jobs/aa-ml-aml-workspace/azureml/cats-vs-dogs-tensorflow_1570804147_39168dcf/mounts/workspaceblobstore/azureml/cats-vs-dogs-tensorflow_1570804147_39168dcf/tmp/数据集
【问题讨论】:
标签: azure tensorflow azure-machine-learning-service