【发布时间】:2012-07-02 03:38:07
【问题描述】:
我在这里需要一些指导。我一直在尝试为我的项目标准化 TF-IDF 结果。所以,我在想TF-IDF 之后的下一步是什么?我想对那些标准化的 TF-IDF 进行 k-means 聚类,但 现在是时候了吗?在此之前,我使用 Lucene 创建了索引,如果可能,我不想使用 Mahout,因为我使用的是 Windows(也不想使用 cygwin)。
对于这些 lucene-ed 和 tf-idf-ed 结果做什么(以及如何)做 k-means 有任何建议?我在这里迷路了..
【问题讨论】:
-
你到底想达到什么目的。聚类结果?还是别的什么?
-
是的,我想对结果进行聚类。那么结果应该在集群中,我们可以通过选择集群号来查看它们。任何代码示例或链接,我该怎么做?
标签: normalization cluster-analysis k-means tf-idf