【问题标题】:MPI and Slurm conceptsMPI 和 Slurm 概念
【发布时间】:2016-01-01 06:32:09
【问题描述】:

我在理解以下基本概念方面有点困难:

  • 当 MPI 分配等级来标识计算时,究竟是谁获得了等级:进程、线程、cpu 等?
  • 如何指定我想在 X 数量的 cpu 上运行 mpi 作业,同时使用 slurm,我看到的所有参数都是用于使用节点的?
  • 使用 mpirun 和使用 srun 有什么区别?
  • 我可以跨多个分区运行 mpi 作业吗?

【问题讨论】:

  • 大多数遵循最新发布版本的标准 (MPI 3.1) 的生产 MPI 实现为进程分配等级。通过所谓的 endpoints 处理单个线程的能力可能会成为 MPI 4.0 的一部分。其余问题是题外话,不属于 Stack Overflow。

标签: mpi slurm


【解决方案1】:

当 MPI 分配一个等级来识别一个计算时,谁得到了 分配等级:进程、线程、cpu 等?

一个进程

如何指定 我想在 X 数量的 cpu 上运行 mpi 作业,同时使用 slurm, 我看到的所有参数都是使用节点?

使用--ntasks 参数

有什么区别 在使用 mpirun 和使用 srun 之间?

两者都用于在远程节点上启动进程。前者由您的 MPI 实现提供,而后者由 Slurm 提供。是否可以使用 Slurm 的 srun 启动 MPI 工作取决于 MPI 实现。详情请见here

我可以运行 mpi 作业吗 多个分区

没有。 Slurm 将始终将节点从单个分区分配给作业

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-06-17
    • 1970-01-01
    • 1970-01-01
    • 2018-05-31
    • 2016-07-21
    • 2016-05-06
    • 2011-03-28
    • 1970-01-01
    相关资源
    最近更新 更多