【发布时间】:2014-10-28 06:09:02
【问题描述】:
我正在尝试使用 scikit-learn 中的 AgglomerativeClustering 来对某个地方的点进行聚类。点由存储在 _XY 中的坐标 (X,Y) 定义。
通过由下式定义的连接矩阵,集群仅限于少数邻居
C = kneighbors_graph(_XY, n_neighbors = 20).
我希望一些点不属于同一个集群,即使它们是邻居,所以我修改了连接矩阵以在这些点之间放置 0。
算法运行平稳,但最后,一些簇包含不应该在一起的点,即我强加了 _C = 0 的一些点。
从孩子们的角度来看,我可以看到问题出现在两个点 (i, j) 的集群已经形成并且 k 加入 (i,j) 时,即使 _C[i,k]=0。
所以我想知道当某些集群的大小大于 2 时,连接约束是如何传播的,在这种情况下没有定义 _C。
谢谢!
【问题讨论】:
标签: scikit-learn connectivity hierarchical-clustering