【发布时间】:2021-04-06 01:12:06
【问题描述】:
我将 Dask 与深度学习模型和大型数组一起使用。特别是,我正在尝试使用 map_blocks 进行预测
array.map_blocks(model.predict)
由于序列化需要时间,有没有办法避免每次调用都序列化模型?
【问题讨论】:
-
如果你事先将模型分散给工人会发生什么?
我将 Dask 与深度学习模型和大型数组一起使用。特别是,我正在尝试使用 map_blocks 进行预测
array.map_blocks(model.predict)
由于序列化需要时间,有没有办法避免每次调用都序列化模型?
【问题讨论】:
至少有两个广泛的选择:
fut_model = client.scatter(model)
array.map_blocks(lambda x: fut_model.predict(x))
def model_predict(X_chunk):
model = pickle.load(mypath) # or another loading method
return model.predict(X_chunk)
array.map_blocks(model_predict)
您可能还会发现 these answers 相关。
【讨论】: