【问题标题】:How to divide an input file into shards/files for MapReduce如何将输入文件划分为 MapReduce 的分片/文件
【发布时间】:2014-03-30 05:22:38
【问题描述】:

所以我正在使用 Map Reduce 框架开发 wordcount 程序,我终于明白了它是如何工作的以及我需要实现什么。但是我很困惑如何将单个输入划分为不同的分片,然后使用线程为每个分片分配一个地图工作者。我知道您可以使用 Linux 命令 split 创建不同的文件,但我不明白如何从主文件中为每个文件分配一个 map worker

非常感谢

【问题讨论】:

    标签: c linux multithreading mapreduce word-count


    【解决方案1】:

    你没有。您使用的 InputFormat 会自动处理。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-03-14
      • 2013-06-26
      • 2017-06-02
      • 2012-07-03
      • 1970-01-01
      • 1970-01-01
      • 2012-05-28
      • 2013-02-09
      相关资源
      最近更新 更多