【发布时间】:2019-10-06 20:00:26
【问题描述】:
我有一个 python 应用程序,它为 GCP 上的机器学习任务构建数据集。
目前我必须启动我们拥有的 VM 实例,然后通过 SSH 进入并运行应用程序,这将在 2-24 小时内完成,具体取决于请求的数据集的大小。
数据集完成后,VM 需要关闭,因此我们不会产生额外费用。
我希望尽可能简化此过程,以便我们拥有“1 单击”或“1 命令”解决方案,但我不确定最佳方式。
从我目前所读到的内容来看,容器似乎是一个不错的选择,但我对 docker 缺乏经验。
我可以设置一个容器来pip install 来自我们私有 GitHub 的最新应用程序,并在关闭之前执行数据集构建吗?我如何将信息传递给容器,例如从哪里获取配置文件等?可以想象,我们会根据不同的配置文件同时生成多个数据集。
有没有比容器更有效的 gcloud 功能更适合我们的目的?
我正在努力获取有关这些基本问题的信息,容器教程似乎以网络应用为主。
【问题讨论】:
标签: gcloud