【发布时间】:2020-03-30 11:23:13
【问题描述】:
如何在 Slurm 中设置每个作业可以要求的最大 CPU 数量?
我们正在运行一个 GPU 集群,并希望有合理数量的 CPU 始终可用于 GPU 作业。只要工作需要 GPU,这很好,因为gres.conf 中有 GPU CPU 映射。但这并不会停止一项不要求任何 GPU 不获取系统中所有 CPU 的工作。
【问题讨论】:
标签: slurm
如何在 Slurm 中设置每个作业可以要求的最大 CPU 数量?
我们正在运行一个 GPU 集群,并希望有合理数量的 CPU 始终可用于 GPU 作业。只要工作需要 GPU,这很好,因为gres.conf 中有 GPU CPU 映射。但这并不会停止一项不要求任何 GPU 不获取系统中所有 CPU 的工作。
【问题讨论】:
标签: slurm
要设置单个作业可以使用的最大 CPU 数量,在集群级别,您可以运行以下命令:
sacctmgr modify cluster <cluster_name> set maxtresperjob=cpu=<nb of CPUs>
请注意,您的配置文件中必须包含 SelectType=select/cons_tres 才能正常工作。
或者,同样的限制可以应用于分区、QOS、帐户等。
【讨论】: