【问题标题】:How to prevent Hue in CDH from clearing job history on restart?如何防止 CDH 中的 Hue 在重启时清除作业历史记录?
【发布时间】:2016-04-07 16:34:30
【问题描述】:

我已经安装了CDH 5.5.1HueHadoopSparkHiveOozieYarnZooKeeper

当我运行 Spark 作业或 MapReduce 作业时,Hue 会在作业历史记录中显示问题。问题是当我重新启动CDH 服务(不是物理节点)时,它会删除重新启动之前的所有作业历史记录。

在 Hadoop 上,我怀疑有几个文件包含有关任务的信息,并且可能是保存作业信息的文件。他们的hadoop路径是:

  • /tmp/logs/user/logs/
  • /user/history/done/2016/

我在Cloudera Manager配置页面、Hue配置页面和一些配置文件中找过,没有成功。我不知道如何防止这种删除。我错过了什么吗?

【问题讨论】:

标签: hadoop apache-spark cloudera-cdh hue cloudera-manager


【解决方案1】:

如果您真的只需要查看 Hadoop 集群上的作业历史记录,YARN 历史服务器应该有在集群上运行的所有 YARN 作业的历史记录。

对于您描述的问题,Hue 有一张 JIRA 票证,标题为“作业浏览器应与 YARN 历史服务器对话以显示旧作业”:https://issues.cloudera.org/browse/HUE-2558。基本上,Hue 需要与 YARN 历史服务器(而不仅仅是资源管理器)对话以获取您正在寻找的信息。

好消息是,该任务似乎已完成并包含在 Hue 4.0 的发布中,该版本于 2017 年 5 月 11 日发布。坏消息是 Cloudera 尚未发布包含该版本的 Hue 的发布。

【讨论】:

    猜你喜欢
    • 2011-08-13
    • 1970-01-01
    • 2017-01-29
    • 2016-08-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多