【发布时间】:2013-10-28 21:38:32
【问题描述】:
我正在使用 TestDFSIO 和 TeraSort 基准测试工具执行几个 Hadoop 测试。我基本上是在使用不同数量的数据节点进行测试,以评估处理能力的线性度和数据节点的可扩展性。
在上面提到的过程中,我显然不得不重启几次所有的Hadoop环境。每次我重新启动 Hadoop 时,都会删除所有 MapReduce 作业,并且作业计数器会从“job_2013*_0001”重新开始。出于比较的原因,保持之前启动的所有 MapReduce 作业对我来说非常重要。所以,我的问题是:
¿如何避免 Hadoop 在重新启动后删除所有 MapReduce 作业历史记录? ¿ Hadoop 环境重启后是否有一些属性可以控制作业删除?
谢谢!
【问题讨论】: