【发布时间】:2011-07-31 08:44:35
【问题描述】:
嗨 我是Cluster 的新手,我不知道哪种算法适合我的任务。让我描述一下我的任务:
- 首先,给定一组点以及它们之间的距离
- 根据距离将它们聚类成几个聚类。
- 将添加几个新点,同时给出所有点之间的距离。
- 重复 2
例如,首先我们有以下矩阵
| p1 | p2 | p3 |
---|----|----|----|
p1 | | | |
p2 | d1 | | |
p3 | d2 | d3 | |
聚类后,我们添加一个新的点,距离也给出:
| p1 | p2 | p3 | p4 |
---|----|----|----|----|
p1 | | | | |
p2 | d1 | | | |
p3 | d2 | d3 | | |
p4 | d4 | d5 | d6 | |
这里的问题是速度,我希望集群是增量集群,即后面的集群可以利用之前的结果。因为我们会经常添加点(如果我们找到一个),如果我们每次都重新聚类点。即使集群本身有O(n),集群的总时间也会是O(n^2)。
有什么建议吗?
谢谢
【问题讨论】:
-
您需要更具体地了解集群。如果 p1-p2 d,你仍然将 p1,p2,p3 聚集在一起吗?
标签: algorithm cluster-analysis k-means