【问题标题】:Change CPU count for RUNNING Slurm Jobs更改 RUNNING Slurm 作业的 CPU 计数
【发布时间】:2019-09-05 10:25:42
【问题描述】:

我有一个 SLURM 集群和一个 RUNNING 作业,我在其中请求了 60 个线程

#SBATCH --cpus-per-task=60

(我正在使用 cgroups 在节点上共享线程)

我现在想将线程数量减少到 30 个。

$ scontrol update jobid=274332 NumCPUs=30
Job is no longer pending execution for job 274332

作业仍然分配了 60 个线程。

$ scontrol show job 274332
JobState=RUNNING Reason=None Dependency=(null)
NumNodes=1 NumCPUs=60 NumTasks=1 CPUs/Task=60 ReqB:S:C:T=0:0:*:*

正确的方法是如何做到这一点?

谢谢!

【问题讨论】:

    标签: linux centos hpc slurm


    【解决方案1】:

    在当前版本的 Slurm 中,scontrol 只允许减少分配给正在运行的作业的节点数量,但不能减少 CPU(或内存)的数量。

    FAQ 说:

    使用 scontrol 命令更改作业的大小,方法是为作业指定一个新节点计数 (NumNodes=),或标识 特定节点 (NodeList=)您希望保留这份工作。

    (强调我的)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-03-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-11-26
      • 2022-01-14
      相关资源
      最近更新 更多