【问题标题】:Print the number of cpus in use per job in slurm?在 slurm 中打印每个作业使用的 cpu 数量?
【发布时间】:2021-03-03 19:19:11
【问题描述】:

我们已切换到使用来自 sge 的 slurm 用于我们的集群作业排队系统。在 sge 中,当您使用 qstat 函数时,它会打印每个作业正在使用的 CPU/插槽数 - 在 slurm 中是否有一种简单的方法可以做到这一点? squeue 仅显示每个作业使用的节点数。谢谢。

         JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
           1981      q      run-01     root  R      16:21      1 node001
           1982      q      run-02     root  R      16:21      1 node002
           1983      q      run-03     root  R      16:21      1 node003

【问题讨论】:

    标签: slurm


    【解决方案1】:

    squeue 命令有两个参数,允许选择在输出--format--Format 中显示的列。每个都有一个选项(分别为 %cNumCPUs)来显示作业请求的内核数。

    试试

    squeue -o "%.18i %.9P %.8j %.8u %.2t %.10M %.6D %R %c"
    

    这将显示默认列并将核心数添加为最后一列。您可以摆弄格式字符串以根据需要排列列。然后,当您对输出感到满意时,可以将其设置为 .bash_profile.bashrc 中的 SQUEUE_FORMAT 变量的值。

    export SQUEUE_FORMAT='%.18i %.9P %.8j %.8u %.2t %.10M %.6D %R %c'
    

    有关详细信息,请参阅squeue man page

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-11-12
      • 2021-09-04
      • 2022-07-12
      • 2013-11-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多