【发布时间】:2014-10-13 14:03:36
【问题描述】:
我正在尝试使用来自 Hadoop 的 MultipleInputs。我所有的映射器都将是 FixedLengthInputFormat。
MultipleInputs.addInputPath(job,
new Path(rootDir),
FixedLengthInputFormat.class,
OneToManyMapper.class);
问题是每个映射器都有不同大小的固定记录宽度。
config.setInt(FixedLengthInputFormat.FIXED_RECORD_LENGTH, ??);
是否有使用 MultipleInputs 为每个映射器传递 FIXED_RECORD_LENGTH 的方法?
谢谢!
【问题讨论】:
-
我会尝试重写一些方法来给出这种行为......如果我成功了,我会在这里发布......
标签: hadoop mapreduce apache-pig