【发布时间】:2013-07-29 20:30:09
【问题描述】:
我想编写一个执行 MapReduce 作业的 Java 程序(例如字数统计)。输入来自 Redis。如何编写 Map 类以从 Redis 中一一检索并在 Map 类中执行一些过程,就像我之前从 HDFS 读取一样?
【问题讨论】:
标签: java hadoop mapreduce redis
我想编写一个执行 MapReduce 作业的 Java 程序(例如字数统计)。输入来自 Redis。如何编写 Map 类以从 Redis 中一一检索并在 Map 类中执行一些过程,就像我之前从 HDFS 读取一样?
【问题讨论】:
标签: java hadoop mapreduce redis
【讨论】:
显然,您需要自定义您的 InputFormat。 请阅读this 教程,了解如何编写自己的自定义 InputFormat 和 RecordReader。
【讨论】:
将您的密钥放在 HDFS 中。在map()中,只需根据输入key从redis中查询即可。
【讨论】: