【发布时间】:2014-05-01 13:32:02
【问题描述】:
我需要在所有 Windows 的 15 台机器(每台 4 核)上运行数千个模型。我开始学习parallel、snow 和snowfall 包并阅读了一堆介绍,但它们主要集中在大师的设置上。 关于如何在 Windows 上设置工作(从)节点的信息很少。信息往往相互矛盾:some say that SOCK cluster is practically the easiest way to go,其他人声称SOCK cluster setup is complicated on Windows (sshd setup) and the best way to go is MPI。
那么,在 Windows 上安装从节点最简单的方法是什么? MPI、PVM、SOCK 还是 NWS?我的,可能是幼稚的想法是(按优先级列出):
- 使用从节点上的所有 4 个内核(必需)。
- 理想情况下,我只需要带有一些包的 R 和一个从属 R 脚本或 R 函数,它们将侦听某个端口并等待来自主控的任务。
- 理想情况下,可以从集群中动态添加/删除节点。
- 理想情况下,从站将连接到主站 - 因此我不必在主站配置中列出所有从站 IP。
只有 1 是 100% 需要的,2-4 是“会好的”。请求是不是太天真了?
很抱歉,我无法从可用的文档和教程中弄清楚这一点。如果您指出正确的来源,我将不胜感激。
* 请注意,这数千个模型中的每一个至少需要 7 分钟,因此不会产生很大的通信开销。
【问题讨论】:
-
R 将处理工人。您只需要使用现成的工具将所有函数和包导出到它们(在降雪时它是
sfExport和sfLibrary)。 -
@RomanLuštrik,“R 将处理工人” 很高兴知道,但问题是 如何 - 如何我设置它们?您所说的集群类型是什么?
-
查看底部关于 MPI 与 SOCK 的一些示例代码和 cmets ics.uci.edu/~vqnguyen/talks/ParallelComputingSeminaR.pdf
-
哦,抱歉,忘记包含了。我在
SOCK上使用雪。 -
我认为您引用的两个答案并不矛盾。使用一台机器,SOCK 集群非常简单,因为在这种情况下不使用 ssh。除非您是 Windows ssh 专家,否则使用多台机器时,MPI 集群会更容易。
标签: r cluster-computing snow rparallel