【问题标题】:COMPSs application blocked指南针应用程序被阻止
【发布时间】:2016-06-18 08:11:27
【问题描述】:

当执行手册 (http://compss.bsc.es/releases/compss/latest/docs/COMPSs_User_Manual_App_Exec.pdf) 中给出的示例应用程序 increment 时,运行时会被阻塞,并且终端中不会显示错误消息。

输出:

$ runcompss increment.Increment 3 1 2 3
Using default location for project file: /opt/COMPSs/Runtime/configuration/xml/projects/project.xml
Using default location for resources file: /opt/COMPSs/Runtime/configuration/xml/resources/resources.xml

----------------- Executing increment.Increment --------------------------

WARNING: IT Properties file is null. Setting default values
[   API]  -  Deploying COMPSs Runtime v1.3 
[   API]  -  Starting COMPSs Runtime v1.3
Initial counter values:
- Counter1 value is 1
- Counter2 value is 2
- Counter3 value is 3

我如何知道是什么阻止了我的应用程序?

提前谢谢你

编辑: 检查 $HOME/.COMPSs/increment*/runtime.log 所有任务似乎都被阻止了:

grep "Blocked" runtime.log 
[(410)(2016-03-04 15:48:09,864)       TaskScheduler]    @scheduleTask     -  Blocked: Task(1, increment) 
[(411)(2016-03-04 15:48:09,865)       TaskScheduler]    @scheduleTask     -  Blocked: Task(2, increment) 
[(412)(2016-03-04 15:48:09,866)       TaskScheduler]    @scheduleTask     -  Blocked: Task(3, increment) 

【问题讨论】:

    标签: java distributed-computing hpc compss


    【解决方案1】:

    runtime.log 必须在执行 runco​​mpss 的用户的主文件夹中

    $HOME/.COMPSs/increment*
    

    编辑: 如果所有任务都被阻止,请检查 IncrementItf.java 中定义的约束是否与 resources.xml 中的描述匹配。另一个可能的问题是资源无法启动。

    【讨论】:

    • 谢谢!我找到了,但是非常大。 Grepping它我可以看到我所有的任务都被阻止了。知道发生了什么吗?
    • 您可以查看工作人员的日志,看看那里是否有问题。他们应该在里面:$HOME/.COMPSs/increment*/workers
    • 您是否在任务中定义了约束?
    【解决方案2】:

    任务被阻止有两个原因:

    • xml 文件上的资源配置不正确。
    • 可用资源不满足任务限制(不适用于简单示例)

    您应该检查项目和资源 xml 文件。两个文件中应该有一个同名的资源。

    【讨论】:

      【解决方案3】:

      您应该检查 runtime.log 文件,它包含所有 master 的输出。

      【讨论】:

      • 在哪里可以找到 runtime.log 文件?
      • 这是评论,不是答案
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2012-09-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-12-18
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多