【发布时间】:2023-10-23 22:00:01
【问题描述】:
我在 gensim、fasttext、sklearn 上检查了无监督聚类,但没有找到任何文档可以使用无监督学习对我的文本数据进行聚类,而无需提及要识别的聚类数量
例如在 sklearn KMneans 聚类中
km = KMeans(n_clusters=true_k, init='k-means++', max_iter=100)
我必须提供 n_clusters。
在我的例子中,我有文本,它应该自动识别其中的簇数并对文本进行聚类。非常感谢任何参考文章或链接。
【问题讨论】:
-
scikit-learn 中的overview of clustering methods 过了吗?其中有少数没有直接将簇数作为参数。
标签: tensorflow scikit-learn gensim unsupervised-learning fasttext