【发布时间】:2019-05-03 22:33:48
【问题描述】:
我需要专家就如何设置建模应用程序提出建议。我有数千个场景要运行在数千个现金流预测合同上。假设我有 1000 个场景和 1000 个合约,我需要运行 1,000,000 个预测 (1000x1000)。我想使用 dask、ray 或其他方法并行执行此操作。我的数据在数据框中,但我愿意接受更好的建议。我可以为每次运行创建 2 个循环(场景、合同),但这将是连续的。
合同 1 的场景 1
合同 2 的场景 1
合同 3 的场景 1
。 . .
Scenario1000 w Contract1000
我想将计算分配给多个处理器和多个服务器。
我将把我的问题保存在内部循环预测上,我必须在下一次运行 1,000,000 次的每个时间步运行 100 个场景预测。
任何能指引我正确方向的建议都会有所帮助。
【问题讨论】:
-
您应该提供一些代码 sn-ps 显示一些数据示例,以及您想要实现的基本组合变化。实际上,您的措辞过于宽泛,无法给出合理的答案。不过我的预感是,使用 dask 可以相对简单地回答您想要的问题。
标签: python pandas parallel-processing dask