【发布时间】:2013-09-10 12:42:51
【问题描述】:
在作业提交脚本 (Cray XE6) 中,“并行任务数”(-n) 和“每个节点的并行任务数”(-N) 有什么区别?
【问题讨论】:
标签: parallel-processing job-scheduling cray
在作业提交脚本 (Cray XE6) 中,“并行任务数”(-n) 和“每个节点的并行任务数”(-N) 有什么区别?
【问题讨论】:
标签: parallel-processing job-scheduling cray
我在这方面没有经验,但有些谷歌搜索给出了:
It looks like a MPI parameter in an example:
# Launch the parallel job using aprun.
# Run the executable my_mpi_executable.x using total
# of 2048 parallel tasks, with 32 tasks assigned per node.
aprun -n 2048 -N 32 ./my_mpi_executable.x arg1 arg2
每个 Cray XE6 刀片包括四个计算节点,用于高 占用空间小,可扩展性 - 每个最多 128 个处理器内核 刀片或每个机柜 3,072 个处理器内核。 每个计算节点 有两个 AMD Opteron™ 6300 系列处理器(16 核)耦合 具有自己的内存和 Gemini 通信接口,并且是 旨在高效运行多达 32 个 MPI 任务。或者,它可以 编程为在计算节点和 MPI 中运行 OpenMP 节点之间。
根据上面的信息,对于一个完整的机柜,n 可以达到 3072,对于两个 opteron(6300 系列),n 可以是 32。
【讨论】:
man aprun 将解决您的所有问题。
-n 表示您想要多少个可执行文件实例(对于 MPI,这表示您想要多少个 MPI 进程)。
-N 表示每个节点需要多少个实例。
-d 是深度,即每个实例有多少线程。
【讨论】: