【发布时间】:2015-11-18 12:07:30
【问题描述】:
我想使用带有 perl 脚本的 hadoop-streaming 功能作为映射器和缩减器。我发现 this explanation 部分回答了我的问题,但是它不包含 reducer 的功能,它为每个键一起处理所有值。
例如,mapper 可能会提取对,reducer 将输出每个产品的类别列表。这当然可以通过将所有 reducer 数据保存在内存中来实现(就像我之前提到的示例一样),但在许多情况下,这是不可扩展的。有没有办法让 perl 脚本一次获取每个键的所有值(如普通的 map-reduce 作业)?
【问题讨论】:
标签: perl hadoop mapreduce hadoop-streaming