【问题标题】:how to run mpi on cluster?如何在集群上运行 mpi?
【发布时间】:2015-10-09 03:57:37
【问题描述】:

my_hostfile.txt 是:

node1 slots=12 max-slots=12
node2 slots=12 max-slots=12
node3 slots=12 max-slots=12
node4 slots=12 max-slots=12

为了运行程序,我使用了这个命令:

mpirun --hostfile my_hostfile.txt -pernode -n 48 ./run_mpi 13-4 -l 13 -d 4

结果:

--------------------------------------------------------------------------
Open RTE detected a parse error in the hostfile:
    my_hostfile.txt
It occured on line number 1 on token 1.
--------------------------------------------------------------------------
[node4:30641] [0,0,0] ORTE_ERROR_LOG: Error in file rmgr_urm.c at line 358
[node4:30641] mpirun: spawn failed with errno=-1

我该怎么办?

【问题讨论】:

  • 确保主机文件是 ASCII 而不是 2 字节的 Unicode。或者开头可能有一个 UTF-8 BOM。

标签: c++ mpi cluster-computing


【解决方案1】:

就我而言,这是因为我在 Windows 中通过 VSCode 编辑主机文件,而行尾默认为 CRLF。通过切换到LF,问题就消失了。

【讨论】:

    猜你喜欢
    • 2018-09-28
    • 2017-01-09
    • 2018-03-09
    • 1970-01-01
    • 2019-11-18
    • 1970-01-01
    • 1970-01-01
    • 2020-04-21
    • 1970-01-01
    相关资源
    最近更新 更多