【问题标题】:Running a GNU parallel command using python subprocess使用 python 子进程运行 GNU 并行命令
【发布时间】:2021-11-10 20:43:23
【问题描述】:

这是一个简单的 GNU 并行命令,它在名为“example_i”的现有目录中创建一个名为“example_i.txt”的文件。它这样做了四次,对于 i 从 1 到 4,每个核心一个作业:

parallel -j 4 'cd example_{} && touch example_{}.txt' ::: {1..4}

我知道,这不是很令人兴奋。当我尝试使用 subprocess 模块通过 python (v3.9) 运行时出现问题,如下所示:

import subprocess
cmd = "parallel -j 4 'cd example_{} && touch example_{}.txt' ::: {1..4}"
subprocess.run(cmd, shell=True)

执行此操作时出现此错误:

/bin/sh: 1: cd: can't cd to example_{1..4}

看起来像使用 python 子进程调用,bash 没有作为 GNU 并行命令正确触发调用。相反,它明确地替换了{1..4},而不是将其分成四个工作。

我也尝试过使用不太可取的os.system(cmd) 语法并返回相同的错误。

PS:就上下文而言,这个问题源于我试图使用UQpy(特别是RunModel module)对交给我的 Fortran 代码进行不确定性量化。虽然这与问题没有直接关系,但它是相关的,因为我想知道如何使用 这些 工具使其工作,因为我无权更改它们。

【问题讨论】:

  • 我认为您要么需要确保subprocess.run() 使用bash,要么通过将{1..4} 替换为1 2 3 4 来避免"bashisms"

标签: python bash multiprocessing subprocess gnu-parallel


【解决方案1】:

根据@Mark Setchell 的评论,在documentation for subprocess 中可以看到bash 似乎在POSIX 上默认不使用。这可以通过将我的 python 代码 sn-p 重写为:明确告诉 subprocess 使用 bash 来解决:

import subprocess
cmd = "parallel -j 4 'cd example_{} && touch example_{}.txt' ::: {1..4}"
subprocess.run(cmd, shell=True, executable='/bin/bash')

需要注意的是,虽然executable 参数在这里被用在subprocess.run() 调用中,但它并不是这个类的直接一部分。 executable 参数实际上是 subprocess.Popen() 类的一部分,但 subprocess.run() 可以通过 **other_popen_kwargs 参数访问它。

【讨论】:

    最近更新 更多