【问题标题】:Oozie Hive Action stuck in PREP state and the job stuck in RUNNING stateOozie Hive Action 卡在 PREP 状态,作业卡在 RUNNING 状态
【发布时间】:2014-11-14 17:29:03
【问题描述】:

我的 Oozie Hive 操作永远停留在运行模式。 oozie.log 文件中没有显示错误。

<workflow-app xmlns="uri:oozie:workflow:0.2.5" name="example-wf">
<credentials>
            <credential name='hive_credentials' type='hive'>
                    <property>
                         <name>hive.metastore.uris</name>
                         <value>thrift://localhost:9083</value>
                    </property>
            </credential>
</credentials>
<start to="hive-example"/>
<action name="hive-example" cred="hive_credentials">
    <hive xmlns="uri:oozie:hive-action:0.2">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <job-xml>hive-site.xml</job-xml>
            <configuration>
                <property>
                    <name>oozie.log.hive.level</name>
                    <value>DEBUG</value>
                </property>
                <property>
                    <name>oozie.hive.defaults</name>
                    <value>hive-default.xml</value>
                </property>
            </configuration>     
        <script>script.q</script>
        <file>hive-site.xml</file>
    </hive>
    <ok to="end"/>
    <error to="fail"/>
    </action>
    <kill name="fail">
    <message>Workflow failed, error message[${wf:errorMessage(wf:lastErrorNode())}] 
    </message>
   </kill>
   <end name="end"/>
   </workflow-app>

另外我的job.properties如下图

nameNode=hdfs://hadoopmaster:54310
jobTracker=localhost:54311
workflowRoot=${nameNode}/user/${user.name}/oozie-workflows
oozie.wf.application.path=hdfs://hadoopmaster:54310/home/hadoopuser/Downloads/oozie
workflows

我的工作日志如下所示

2014-11-13 18:19:57,697 INFO ActionStartXCommand:539 - USER[hadoopuser] GROUP[-] TOKEN[] APP[example-wf] JOB[0000001-141113180803793-oozie-hado-W] ACTION[0000001 -141113180803793-oozie-hado-W@:start:] 开始操作 [0000001-141113180803793-oozie-hado-W@:start:] 用户重试状态:userRetryCount [0], userRetryMax [0], userRetryInterval [10] 2014-11-13 18:19:57,698 WARN ActionStartXCommand:542 - USER[hadoopuser] GROUP[-] TOKEN[] APP[example-wf] JOB[0000001-141113180803793-oozie-hado-W] ACTION[0000001-141113180803793- oozie-hado-W@:start:] [0000001-141113180803793-oozie-hado-W@:start:]Action status=DONE 2014-11-13 18:19:57,698 WARN ActionStartXCommand:542 - USER[hadoopuser] GROUP[-] TOKEN[] APP[example-wf] JOB[0000001-141113180803793-oozie-hado-W] ACTION[0000001-141113180803793- oozie-hado-W@:start:] [0000001-141113180803793-oozie-hado-W@:start:]操作已在数据库中更新! 2014-11-13 18:19:57,801 信息 ActionStartXCommand:539-用户 [hadoopuser] 组 [-] 令牌 [] 应用程序 [示例 wf] 作业 [0000001-141113180803793-oozie-hado-W] 操作 [0000001-141113180803793- oozie-hado-W@hive-example] 使用用户重试状态开始操作 [0000001-141113180803793-oozie-hado-W@hive-example]:userRetryCount [0]、userRetryMax [0]、userRetryInterval [10]

我已将我的 hive-site.xml 放在 oozie 的工作流目录中,并将工作流目录(包含 workflow.xml、hive-site.xml、hive-default.xml)上传到 HDFS。作业日志中没有错误。所以我不确定我在哪里犯了错误。任何帮助是极大的赞赏。

【问题讨论】:

  • 为什么我们在
  • 我在 mac 上的单节点集群设置中遇到了同样的问题。我无法运行 oozie-examples 附带的简单 map-reduce 工作流

标签: hadoop hive oozie job-scheduling


【解决方案1】:

您的集群设置有多少个容器? 当您执行工作流时,一个容器将被 oozie 占用(它会继续持有该容器直到查询执行),其余的将用于执行实际的作业。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-12-22
    • 1970-01-01
    • 2023-02-14
    • 1970-01-01
    相关资源
    最近更新 更多