【问题标题】:Cgroup and SlurmCgroup 和 Slurm
【发布时间】:2023-07-02 19:04:02
【问题描述】:

我知道如何使用 cgroups(分配内存、cpu 使用...)和 slurm(提交、暂停/停止作业)。我想知道 cgroups 如何与 slurm 一起工作。当我向 slurm 提交作业时,我可以在哪里修复内存或 CPU 使用率?我从 Slurm Schedmd(https://slurm.schedmd.com/cgroups.html) 阅读了文档,但没有给出很好的解释。也许这是我的一个误解。谁能解释如何在 slurm 中使用 cgroup 为工作分配一些资源?提前致谢。

【问题讨论】:

    标签: slurm cgroups


    【解决方案1】:

    cgroup 在 Slurm 中的使用处于管理员配置级别,并且对用户是透明的。当配置为使用 cgroups 时,Slurm 会根据作业提交时所需的资源(例如 --mem、--ntasks 等)为作业创建 cgroups 并自动删除它们

    【讨论】:

    • 如果用户想在他们工作的 cgroups 上创建另一个 cgroups 级别怎么办?有可能吗?
    • @M.Rez,没有。它必须在 cgroups.conf 中预先配置,