【发布时间】:2020-02-04 08:06:47
【问题描述】:
我最近开始使用 Metaflow 进行超参数搜索。我对所有参数都使用foreach,如下所示:
from metaflow import FlowSpec, step
@step
def start_hpo(self):
self.next(self.train_model, foreach='hpo_parameters')
@step
def train_model(self):
# Trains model...
这很有效,因为它按预期启动了步骤train_model,但不幸的是它希望一次并行化所有步骤。这会导致我的 gpu / cpu 在步骤失败时立即耗尽内存。
有没有办法告诉元流线性地/一次一个地执行这些步骤,或者另一种解决方法?
谢谢
【问题讨论】:
标签: python deep-learning netflix-metaflow