【发布时间】:2010-12-08 11:10:26
【问题描述】:
如何为自定义 Hadoop 类型定义 ArrayWritable?我正在尝试在 Hadoop 中实现倒排索引,并使用自定义 Hadoop 类型来存储数据
我有一个 Individual Posting 类,它存储术语频率、文档 ID 和文档中术语的字节偏移列表。
我有一个 Posting 类,它有一个文档频率(该术语出现的文档数量)和个人帖子列表
我已经为 IndividualPostings
中的字节偏移列表定义了一个 LongArrayWritable 扩展 ArrayWritable 类当我为 IndividualPosting 定义自定义 ArrayWritable 时,我在本地部署后遇到了一些问题(使用 Karmasphere、Eclipse)。
Posting 类列表中的所有 IndividualPosting 实例都是相同的,即使我在 Reduce 方法中得到不同的值
【问题讨论】:
-
您能具体解释一下问题所在吗?也许为您的自定义 ArrayWritable 发布一些代码?