【发布时间】:2013-10-19 23:22:53
【问题描述】:
假设我有项目 i1, ..., iN
我想以这样的方式对它们进行聚类:
- 如果我多次运行集群,项目 iJ 和 iK 最终位于同一集群中的概率很高。
- 无论集群种子如何,集群的数量和集群成员都相对稳定
是否有众所周知的算法来实现这一点?
澄清:
说我想要 3 个集群,然后说:
- 在现实 1 中,我从 i1、i33、i89 作为集群 c1 c2 c3 的种子开始
- 在现实 2 中,我从 i44、i55、i77 作为集群 c1 c2 c3 的种子开始
我希望两个现实中的结果集群大致相似
【问题讨论】:
-
使用确定性算法,如层次聚类或DBSCAN,而不是像k-means这样的随机算法!
标签: machine-learning cluster-analysis unsupervised-learning