【发布时间】:2016-06-12 18:23:47
【问题描述】:
文档有点不清楚-t 选项在使用qsub 提交作业时到底做了什么
http://docs.adaptivecomputing.com/torque/4-0-2/Content/topics/commands/qsub.htm
来自文档:
-t 指定作业数组的任务 ID。允许使用单个任务数组。 array_request 参数是一个整数 id 或一个整数范围。 多个 id 或 id 范围可以组合在一个逗号分隔的列表中。 示例:-t 1-100 或 -t 1,10,50-100
这是一个出现问题的示例,我请求了 2 个节点,每个节点 8 个进程,以及 16 个作业的数组。我曾希望这会自然地分布在 2 个节点上,但 16 个任务是临时分布在超过 2 个节点上的。
$ echo 'hostname' | qsub -q gpu -l nodes=2:ppn=8 -t 1-16
52727[]
$ cat STDIN.o52727-* | sort
gpu-3.local
gpu-3.local
gpu-3.local
gpu-3.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
【问题讨论】:
-
你使用什么调度器?