【发布时间】:2014-12-05 05:11:10
【问题描述】:
我有一个 perl 程序,它将接受一个输入文件并对其进行处理并生成一个输出文件作为结果。现在我需要在 hadoop 上使用这个 perl 程序。因此,perl 程序将在边缘节点上存储的数据块上运行,我不应该修改 perl 代码。我不知道如何开始。有人可以给我任何建议吗?
我可以编写一个java程序,在mapper类中使用process builder调用perl程序并将结果合并到reducer类中吗??
还有其他方法可以实现吗?
【问题讨论】:
标签: java perl hadoop mapreduce hadoop-streaming