【问题标题】:Print out wall time for qsub job打印出 qsub 作业的挂墙时间
【发布时间】:2014-08-12 20:06:49
【问题描述】:

我目前正在使用 qsub 在集群上运行作业,并且对作业施加了 10 小时的挂墙时间。有时作业超过此时间并因此终止,有时作业因其他原因而终止。无论哪种方式,我都希望在 qsub 日志文件的底部有一个页脚,用于指示作业何时终止(可选的状态码指示它是成功完成还是被中断)和总挂墙时间。把类似的东西:

date
command here
date

在 qsub 文件中不起作用,因为如果作业超时,最后一个 date 将不会被执行。有谁知道解决这个问题的方法吗?

【问题讨论】:

    标签: cluster-computing qsub


    【解决方案1】:

    qacct 命令应该会为您提供该信息。来自manpage

    qacct 实用程序扫描记帐数据文件(请参阅accounting(5)) 并生成挂钟时间、CPU 时间、 和系统时间

    否则,如果您确实需要将信息放在输出文件中,您可以尝试类似

    trap "date; exit 2" 2 3 15
    

    在您的脚本中,以便在脚本终止时执行date 命令。

    【讨论】:

    • 谢谢,我可以在作业开始时输出$JOB_ID,然后使用qacct
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-12-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多