对一些数据点进行聚类总是聚集在一起答案

【问题标题】：Doing clustering with some data points always clustered together对一些数据点进行聚类总是聚集在一起
【发布时间】：2018-08-02 10:24:43
【问题描述】：

是否有一些 R 函数可以在 n 数据点 X_1, X_2, ..., X_n 上执行聚类（hclust、kmeans 等），并限制某些点 X_i, X_j, ..., X_k 总是聚类在一起？或者等效地，是否有一些方法可以使用给定的初始集群执行集群{X_i1, X_j1, ..., X_k1}, {X_i2, X_j2, ..., X_k2}, ...

【问题讨论】：

“变量聚集在一起”是什么意思？通常我们想要聚类点，而不是特征......
我把“变量”改成了“数据点”
为什么不直接删除这些点并在其余部分上运行您的聚类算法？
所有数据点都分配给一些初始集群。这些初始聚类被视为元点，并在这些元点上执行聚类

标签： r cluster-analysis

【解决方案1】：

找到解决办法：如果使用“hclust”，将同一个初始簇内的“dist”值设置为0，这样每个初始簇内的点都会一直聚在一起；如果使用“kmeans”，则用定义为簇质心的新点表示每个初始簇

【讨论】：