【发布时间】:2023-03-07 06:00:01
【问题描述】:
你好,我刚刚想出了一个奇怪的任务:
我使用 EMR 运行 java-MapReduce 作业。
数据大约1T,我用了1个master+8个slave。
所有实例都是 r2.2xlarge。
最初,一切看起来都很好,如下所示:
INFO mapreduce.Job: map 0% reduce 0%
INFO mapreduce.Job: map 1% reduce 0%
INFO mapreduce.Job: map 2% reduce 0%
INFO mapreduce.Job: map 3% reduce 0%
INFO mapreduce.Job: map 4% reduce 0%
INFO mapreduce.Job: map 5% reduce 0%
INFO mapreduce.Job: map 6% reduce 0%
INFO mapreduce.Job: map 7% reduce 0%
...
但是,我刚刚注意到进度转为回滚(从 7% 下降到 1%)。
INFO mapreduce.Job: map 4% reduce 0%
INFO mapreduce.Job: map 5% reduce 0%
INFO mapreduce.Job: map 6% reduce 0%
INFO mapreduce.Job: map 7% reduce 0%
INFO mapreduce.Job: map 6% reduce 0%
INFO mapreduce.Job: map 5% reduce 0%
INFO mapreduce.Job: map 4% reduce 0%
INFO mapreduce.Job: map 3% reduce 0%
....
当我像3G数据一样测试时,结果是对的,过程很顺利,没有出现这种情况。
谁能告诉我为什么会发生这种情况?
最好的。
【问题讨论】:
标签: amazon-web-services hadoop mapreduce amazon-emr elastic-map-reduce