【发布时间】:2020-01-18 12:27:18
【问题描述】:
我正在尝试使用集群来运行 MPI 代码。集群硬件由 30 个节点组成,每个节点具有以下规格: 2 个插槽 16 核(Intel Xeon e5-2650 v2)-(启用多线程的 32 核) 64 GByte 1866 MT/s 主内存 命名:咏叹调
slurm 配置文件如下:
#SBATCH --ntasks=64 # Number of MPI ranks
#SBATCH --cpus-per-task=1 # Number of cores per MPI rank
#SBATCH --nodes=2 # Number of nodes
#SBATCH --ntasks-per-node=32 # How many tasks on each node
#SBATCH --ntasks-per-socket=16 # How many tasks on each CPU or socket
#SBATCH --mem-per-cpu=100mb # Memory per core
当我提交作业时,返回消息包含以下内容:sbatch:错误:批处理作业提交失败:请求的节点配置不可用 这有点令人困惑。我每个 cpu 提交一个任务,并在节点和套接字之间平均分配任务,有人可以就上述配置的问题提出建议吗?还有一件事:根据硬件规格,最佳配置是什么?
提前致谢
【问题讨论】:
标签: slurm