【问题标题】:Batch job submission failed: I/O error writing script/environment to file批处理作业提交失败:将脚本/环境写入文件的 I/O 错误
【发布时间】:2021-05-12 21:04:43
【问题描述】:

我在工作站上安装了 slurm,它似乎可以工作,我可以使用 slurm 命令,srun 也可以工作。 但是当我尝试使用sbatch test.sh 从脚本启动作业时,我收到以下错误:批处理作业提交失败:I/O 错误将脚本/环境写入文件,即使脚本是最简单的喜欢 #!/bin/bash srun hostname

【问题讨论】:

  • slurmd 是否以 root 身份运行?
  • 是的,它以 root 身份运行
  • Slurm 似乎抱怨它无法写入SlurmdSpoolDir 定义的位置。可能是错误的或只读的文件系统?
  • 是的,原来是权限问题,我有 root 用户的 rw 权限,但在我的 conf 文件中,用户设置为 slurm。我将其更改为 root 并且它有效。

标签: jobs slurm submission sbatch


【解决方案1】:

确保slurmdroot 运行。请参阅slurm.conf 中的SlurmdUser 参数。它的默认值是root,应该是这样。

注意,这与SlurmUser 参数不同,后者定义了运行控制器进程的用户;这个最好不要root

如果配置正确,那么您可能在SlurmdSpoolDir 参数中引用的位置有一个错误的文件系统,其中slurmd 为分配给节点的作业编写提交脚本和环境。

【讨论】:

    最近更新 更多