【问题标题】:torque qsub making jobs dependent on other jobs扭矩 qsub 使工作依赖于其他工作
【发布时间】:2018-01-25 10:28:35
【问题描述】:

我想使用 qsub 启动一堆作业,并且只有在所有其他作业都“没有错误”完成时才能运行最终作业。在我的情况下,“没有错误”意味着他们以 status=0 退出。 qsub 的手册页在 -W depend=afterok 描述中说:只有在作业 jobid 没有错误终止后,才能安排此作业执行。

不幸的是,它似乎没有解释(或者我找不到)“没有错误”的含义。我的一些脚本很可能会将信息打印到 stderr,但我不希望这被解释为错误。

问题 1:qsub 文档中的“没有错误”是什么意思? 问题 2:如何使作业显式依赖于以状态 0 退出的所有作业集合?

【问题讨论】:

    标签: qsub torque


    【解决方案1】:
    1. 没有错误 = 以状态 0 退出。如果作业以非零退出状态退出,则视为错误。
    2. 你可以链接依赖:qsub -W depend=afterok:job1:job2:job3

    【讨论】:

    • 我运行了一个测试,确实似乎如果一个作业打印到stderr,但存在status=0,那么错误会被打印到错误中很长,但是-Wdepend=afterok仍然认为还可以,没有失败。太好了。
    猜你喜欢
    • 1970-01-01
    • 2020-05-08
    • 2023-01-30
    • 2017-03-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-14
    • 1970-01-01
    相关资源
    最近更新 更多