【发布时间】:2013-01-10 19:23:15
【问题描述】:
我使用以下方法运行 K-Means:
KMeansDriver.run(new Path("./bd.seq.file"), new Path(clustersLoc), new Path("output"),
new EuclideanDistanceMeasure(), 0.001, 10, true, 0.5, false);
我的目标是知道我的每个原始向量属于哪个集群。 据我了解,这应该在 output/clusteredPoints/part-m-00000 中,但是这个文件看起来像一个空的(120 字节)序列文件。
什么给了?
【问题讨论】:
-
我刚刚发现的另一个线索。这只发生在 Mahout 0.7 上。所以,这要么是一个错误,要么是一个未记录的行为变化。在 Mahout 0.5 中,我在路径 output/clusteredPoints /part-m-00000 下获得了一个文件,其中包含向量到集群的映射 ...
标签: cluster-analysis mahout k-means