【问题标题】:How many Mappers and Reducers are allotted when a Hive Query is executed执行 Hive 查询时分配了多少个 Mapper 和 Reducer
【发布时间】:2015-04-19 16:44:19
【问题描述】:

当一个 Hive 查询被执行时,有多少个 mapper/reducer 被执行或者当一个 Hive 查询被执行时,如何识别 man mapper 和 reducer 将如何被执行?

【问题讨论】:

    标签: hadoop mapreduce hive


    【解决方案1】:

    Mapper 的数量取决于 jobclient 计算的输入拆分的数量。

    hive 查询就像一系列 Map reduce 作业。如果您编写一个简单的查询,如 select Count(*) from Employee,则只会执行一个 Map reduce 程序。如果您给出一个包含大量聚合和连接等的复杂查询,则将执行一系列 Map Reduce 程序,该程序使用较早的 MR 阶段输出作为下一个 MR 阶段的输入,最终结果将转储到 HDFS 中。

    开发者可以在 Hive Shell 中将 reducer 的数量设置为 ma​​pred.reduce.tasks=x

    【讨论】:

    • 能否请您告诉我一些文档/架构或流程图。这样我就可以更好地了解 Hive 查询的内部工作。
    猜你喜欢
    • 2016-04-26
    • 2012-04-19
    • 1970-01-01
    • 2014-06-06
    • 1970-01-01
    • 1970-01-01
    • 2019-07-22
    • 2021-08-24
    • 1970-01-01
    相关资源
    最近更新 更多