【发布时间】:2015-01-07 11:39:07
【问题描述】:
我正在为 hadoop 构建自定义输出格式,并且想知道输出格式中是否有办法知道所有 reducer (RecordWriters) 何时完成?
为了知道一个RecordWriter完成了,可以使用RecordWriter的close方法,但是当所有RecordWriters完成后执行一些清理呢?
【问题讨论】:
-
你需要什么样的清理工作?
-
我在数据库中创建了一条记录,我需要在 MR 作业结束时将其删除,所以这就是为什么我要问所有 reducer 什么时候结束。
标签: java hadoop mapreduce reduce outputformat