【问题标题】:Doing clustering with some data points always clustered together对一些数据点进行聚类总是聚集在一起
【发布时间】:2018-08-02 10:24:43
【问题描述】:

是否有一些 R 函数可以在 n 数据点 X_1, X_2, ..., X_n 上执行聚类(hclust、kmeans 等),并限制某些点 X_i, X_j, ..., X_k 总是聚类在一起?或者等效地,是否有一些方法可以使用给定的初始集群执行集群{X_i1, X_j1, ..., X_k1}, {X_i2, X_j2, ..., X_k2}, ...

【问题讨论】:

  • “变量聚集在一起”是什么意思?通常我们想要聚类点,而不是特征......
  • 我把“变量”改成了“数据点”
  • 为什么不直接删除这些点并在其余部分上运行您的聚类算法?
  • 所有数据点都分配给一些初始集群。这些初始聚类被视为元点,并在这些元点上执行聚类

标签: r cluster-analysis


【解决方案1】:

找到解决办法:如果使用“hclust”,将同一个初始簇内的“dist”值设置为0,这样每个初始簇内的点都会一直聚在一起;如果使用“kmeans”,则用定义为簇质心的新点表示每个初始簇

【讨论】:

    猜你喜欢
    • 2015-03-10
    • 1970-01-01
    • 2014-11-01
    • 2013-05-15
    • 1970-01-01
    • 2012-11-02
    • 2011-12-13
    • 2013-11-25
    • 1970-01-01
    相关资源
    最近更新 更多