【发布时间】:2013-09-28 01:00:51
【问题描述】:
我曾经使用带 LSF 的服务器,但现在我刚刚过渡到带 SLURM 的服务器。
SLURM 中 bpeek(用于 LSF)的等效命令是什么?
bpeek bpeek 显示未完成作业的标准输出和标准错误输出
我在任何地方都找不到文档。如果您对 SLURM 有一些好的参考资料,也请告诉我。谢谢!
【问题讨论】:
我曾经使用带 LSF 的服务器,但现在我刚刚过渡到带 SLURM 的服务器。
SLURM 中 bpeek(用于 LSF)的等效命令是什么?
bpeek bpeek 显示未完成作业的标准输出和标准错误输出
我在任何地方都找不到文档。如果您对 SLURM 有一些好的参考资料,也请告诉我。谢谢!
【问题讨论】:
我刚刚了解到,在 SLURM 中,不需要执行 bpeek 来检查当前的标准输出和标准错误,因为它们会在运行时打印到为 stdout 和 stderr 指定的文件中。
【讨论】:
scontrol show job <jobid> 来确定标准输出和标准错误的写入位置。如果您有很多作业并且无法轻松跟踪哪个作业 id 写入哪个输出,这很有用。
您可能还想看看sattach 命令。
【讨论】:
Invalid job id specified)。我指定的 id 与squeue 的输出相同,但我不确定使用什么“步骤”。我的脚本中没有使用srun,这有关系吗?我使用sbatch 和一个 bash 脚本运行我的工作,该脚本有一些 slurm 参数,加载一些模块,cd,然后运行一个 python 程序。