【发布时间】:2012-12-18 22:19:38
【问题描述】:
我有这些文件的集合-
objectA-record-data.log 文件 - 包含多行带有时间戳的数据。
objectA-record-metadata.log 文件 - 仅包含一行。将其视为 objectA 的所有记录的元数据。
它们将共同形成一个记录以供处理。
我已经能够处理数据文件了。映射器将 objectA 设置为数据文件中所有行的键,reducer 处理并打印文本文件。现在我想将元数据也添加到这些记录中。有什么想法我该怎么做?
【问题讨论】:
标签: java hadoop mapreduce cloudera