【问题标题】:Debugging htcondor issue running python script调试运行 python 脚本的 htcondor 问题
【发布时间】:2018-06-10 10:34:28
【问题描述】:

我正在向 condor 提交一个 python 脚本。当秃鹰运行时,它得到 导入错误。 Condor 将其运行为 /var/lib/condor/execute/dir_170475/condor_exec.exe。如果我手动复制 python脚本到执行机器并放在同一个地方 并运行它,它不会收到导入错误。我想知道如何 调试这个。

如何查看 condor 用于运行它的命令行?文件可以吗 复制到 /var/lib/condor/execute/dir_170475/condor_exec.exe 失败后保留让我看到吗?任何其他建议 如何调试?

【问题讨论】:

  • 您好,您收到了什么确切的错误信息?是您的文件无法导入还是您导入的其他文件?它适用于其他 python 文件吗?
  • 我得到的错误是ImportError: No module named modules。 modules 是我们的模块之一,它所在的目录存在并且在 python 的 sys.path 中。会不会是权限问题?我在执行机器的 StarterLog.slot1 中看到:Running job as user nobody。我想尝试以没人的身份运行它,但我不能 su 到那个用户。我怎样才能准确地模仿 condor 的功能?

标签: python condor


【解决方案1】:

您可以简单地运行一个交互式作业(基本上只是一个以 sleep 或 cat 作为命令的作业)并执行 ssh_to_job 来运行它。

通常你需要在计算节点上设置你的python环境,最好有一个venv并在你的启动脚本中激活它。

【讨论】:

    猜你喜欢
    • 2020-07-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-10-06
    相关资源
    最近更新 更多