【问题标题】:Hadoop/Hive cluster. only one node utilizationHadoop/Hive 集群。只有一个节点利用率
【发布时间】:2012-09-17 14:52:26
【问题描述】:

我有一个小型 hadoop/hive 集群(总共 6 个节点)。 使用“hadoop dfsadmin -report”,我看到数据节点运行良好且已连接。 此外,当我在配置单元表中添加数据时,我可以看到数据正在分发 遍布整个节点。 (易于检查,随着使用的磁盘空间增加)。

我正在尝试在一张表上创建一些索引。从 jobtracker http 界面,我看到只有一个节点可用。我尝试运行多个查询(我使用 mysql 作为元数据),但它们似乎只在安装了 hive 的节点上运行。

基本上我的问题是如何让 jobtracker 也能利用其他节点。

【问题讨论】:

    标签: configuration hadoop hive


    【解决方案1】:

    从你所说的看来:
    Datanodes 在所有节点上正常运行,并且能够与 namenode 通信。
    任务跟踪器没有在除一个以外的所有节点上运行,或者由于某种原因无法与作业跟踪器通信。
    在检查任务跟踪器确实在运行之后 - 阅读他们的日志以找出他们与 JobTracker 通信的问题。

    【讨论】:

    • 你是对的。我没有注意到它,但作业跟踪器在节点上失败了。它失败的原因是愚蠢的(作业跟踪器日志文件夹的用户权限)。我没有注意到它,尽管一切都在运行。现在修复它,一切正常。
    • 只有小的修正 - 在节点上运行的守护进程是 TaskTracker 不是 JobTrackers
    猜你喜欢
    • 1970-01-01
    • 2016-07-12
    • 1970-01-01
    • 1970-01-01
    • 2017-08-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-04-05
    相关资源
    最近更新 更多