【问题标题】:SLURM display the stdout and stderr of an unfinished jobSLURM 显示未完成作业的标准输出和标准错误
【发布时间】:2013-09-28 01:00:51
【问题描述】:

我曾经使用带 LSF 的服务器,但现在我刚刚过渡到带 SLURM 的服务器。

SLURM 中 bpeek(用于 LSF)的等效命令是什么?

bpeek bpeek 显示未完成作业的标准输出和标准错误输出

我在任何地方都找不到文档。如果您对 SLURM 有一些好的参考资料,也请告诉我。谢谢!

【问题讨论】:

    标签: lsf slurm


    【解决方案1】:

    我刚刚了解到,在 SLURM 中,不需要执行 bpeek 来检查当前的标准输出和标准错误,因为它们会在运行时打印到为 stdout 和 stderr 指定的文件中。

    【讨论】:

    • 不是在我的(诚然有点有限)的经验,虽然它可能是缓冲的。
    • 我要补充一点,您可以使用scontrol show job <jobid> 来确定标准输出和标准错误的写入位置。如果您有很多作业并且无法轻松跟踪哪个作业 id 写入哪个输出,这很有用。
    【解决方案2】:

    您可能还想看看sattach 命令。

    【讨论】:

    • sattach 不相信我的 jobid (Invalid job id specified)。我指定的 id 与squeue 的输出相同,但我不确定使用什么“步骤”。我的脚本中没有使用srun,这有关系吗?我使用sbatch 和一个 bash 脚本运行我的工作,该脚本有一些 slurm 参数,加载一些模块,cd,然后运行一个 python 程序。
    猜你喜欢
    • 2015-03-16
    • 1970-01-01
    • 1970-01-01
    • 2014-07-22
    • 1970-01-01
    • 1970-01-01
    • 2014-08-25
    • 2014-12-28
    • 1970-01-01
    相关资源
    最近更新 更多