【发布时间】:2019-09-05 10:25:42
【问题描述】:
我有一个 SLURM 集群和一个 RUNNING 作业,我在其中请求了 60 个线程
#SBATCH --cpus-per-task=60
(我正在使用 cgroups 在节点上共享线程)
我现在想将线程数量减少到 30 个。
$ scontrol update jobid=274332 NumCPUs=30
Job is no longer pending execution for job 274332
作业仍然分配了 60 个线程。
$ scontrol show job 274332
JobState=RUNNING Reason=None Dependency=(null)
NumNodes=1 NumCPUs=60 NumTasks=1 CPUs/Task=60 ReqB:S:C:T=0:0:*:*
正确的方法是如何做到这一点?
谢谢!
【问题讨论】: