【发布时间】:2011-10-04 16:34:18
【问题描述】:
我想使用 appengine 映射器来迭代一系列日期(从日期和到日期作为属性传递给配置)。对于范围内的每个日期,我将检索具有该日期作为属性的实体并对该集合进行操作。
例如,如果我有以下一组实体:
Key Date Value
a 2011/09/09 323
b 2011/09/09 132
c 2011/09/08 354
d 2011/09/08 432
e 2011/09/08 234
f 2011/09/07 423
g 2011/09/07 543
我想指定 2011/09/09 - 2011/09/07 的日期范围,这将为 2011/09/09、2011/09/08 和 2011/09/07 创建三个映射器实例。反过来,它们将分别查询实体 a+b、c+d+e 和 f+g,并对这些值执行一些操作。 (每个映射器还会对其他数据进行其他数据存储查询,因此下面的“奖励问题”)
大概我需要创建一个自定义 InputFormat 类,但是我对 mapreduce/hadoop 还是很陌生,我希望有人有一些例子?
额外问题:使用 dao 在映射器中加载数据是“糟糕的形式”吗?我使用过的其他分布式计算平台(例如 DataSynapse)将要求您将所有输入打包并提供任务以防止数据服务器上出现过多争用。但是,对于 appengine HR 数据存储,我认为这不是问题?
【问题讨论】:
标签: java google-app-engine hadoop