【发布时间】:2019-04-06 13:10:22
【问题描述】:
我了解 K-Means 可用于通过矢量化和查找文档的 TF-IDF 值来对文档进行聚类。除了分类/连续变量定义之外,我们何时/如何决定哪一个 (K-Means or K-modes) 可能会产生更好的结果?是真的能给出更好的结果还是要根据具体情况?
我已经使用 tf-idf 进行了 KMeans 聚类,它们似乎给出了不错的结果,但我找不到任何材料来比较两者以冒险进入 K-Modes。互联网上关于 k-means+tf-idf 的文本聚类也有很多,而在 k-modes 上则不多。任何帮助表示赞赏!
【问题讨论】:
标签: algorithm cluster-analysis k-means tf-idf unsupervised-learning