【发布时间】:2014-11-17 13:40:25
【问题描述】:
我正在使用 mahout 运行树冠聚类算法。
这是我通过 mahout 命令行运行的命令。
mahout canopy -i /mahout/o_seqsparse/tfidf-vectors -o /mahout/o_canopy -dm org.apache.mahout.common.distance.SquaredEuclideanDistanceMeasure -ow -t1 100 -t2 50
以下是正在运行的 map & reduce 任务的数量:
没有。正在运行的地图任务 --> 6
没有。减少任务的运行 --> 1
但是由于一个减速器,这花费了太多时间。我认为,如果我能够增加 reduce 任务的数量,那么我将获得更好的性能。
我还尝试使用 mapred-site.xml 文件 mapred.map.tasks, mapred.reduce.tasks 增加 map reduce
但这没有任何效果,它仍然以 1 个 reduce 运行。
【问题讨论】:
标签: hadoop mapreduce mahout canopy