【发布时间】:2013-04-09 00:05:51
【问题描述】:
我希望是一个非常简单的问题,但我对 Sun Grid 不是很熟悉,所以我一直很难找到答案。我目前正在使用 bash 提交脚本将作业提交到网格,该脚本生成命令然后执行它。我在网上读到,如果太阳网格作业以 99 的代码退出,它会重新提交到网格。我已经成功编写了我的 bash 脚本来执行此操作:
[code to generate command, stores in $command]
$command
STATUS=$?
if [[ $STATUS -ne 0 ]]; then
exit 99
fi
exit 0
当我使用我知道具有非零退出状态的命令将该作业提交到网格时,该作业确实似乎被重新提交,但是调度程序从未将其发送到另一台主机,而是停留在状态为“Rq”的队列:
job-ID prior name user state submit/start at queue slots ja-task-ID
-----------------------------------------------------------------------------------------------------------------
2150015 0.55500 GridJob.sh my_user Rq 04/08/2013 17:49:00 1
我感觉这在队列的配置选项中很简单,但我无法在谷歌上找到任何东西。我尝试使用qsub -r y 选项提交此作业,但这似乎没有任何改变。
谢谢!
【问题讨论】:
-
Rq 状态代表什么??
标签: grid-computing sungridengine