【问题标题】:How to list hanging mpi jobs如何列出挂起的 mpi 作业
【发布时间】:2013-05-18 20:41:39
【问题描述】:

我正在使用 mpiexec (mpich2) 运行一些作业。
mpiexec 进程以非零状态退出,留下一些工作进程

我可以打印正在运行的子作业列表:

$ps aux | grep mpi

还有其他方法可以列出正在运行/挂起的作业吗?

【问题讨论】:

    标签: mpi jobs mpich


    【解决方案1】:

    如果 MPI 离开了一个僵尸进程(这很奇怪,这真的不应该发生),它将被命名为您最初执行的可执行文件的名称。所以如果你开始你的程序:

    mpiexec -n 4 ./a.out
    

    然后你需要搜索

    ps aux | grep a.out
    

    这将为您提供所有仍在运行的进程的列表。您的建议通常不起作用的原因是,如果 mpirunmpiexec 进程已经消失(由于崩溃或完成),您显然无法继续搜索它。但是,出于某种原因,孩子们可能仍然在身边。

    【讨论】:

      【解决方案2】:

      这可能对您有所帮助:ps aux | grep MPICH

      【讨论】:

      • MPICH 启动的任何内容实际上都没有将 MPICH 作为进程的名称。它们的可执行文件称为mpiexecmpirun
      猜你喜欢
      • 2016-01-23
      • 1970-01-01
      • 2015-05-18
      • 2012-05-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-03-29
      • 1970-01-01
      相关资源
      最近更新 更多