【问题标题】:Dead simple clustering algorithm死简单聚类算法
【发布时间】:2020-07-31 01:29:27
【问题描述】:

如果两个数据项的分离小于某个用户指定的截止值,那么将两个数据项简单地放入同一个簇中的好的聚类算法是什么?

X_clustering(data, distance, epsilon) 的结果是一组簇分配,因此对于任何对 i,j,如果 distance(data[i], data[j]) < epsilon,它们在同一个簇中。如果distance(data[i], data[j]) >= epsilon 它们可以在不同的集群中(如果没有其他数据最终将它们联系起来......)。

另一种说法是:如果存在[i, x, y, z..., j]通过数据的路径,则i,j在同一个集群中,使得每个步骤都是distance<epsilon,如果不存在这样的路径,它们在不同的集群中.

【问题讨论】:

    标签: algorithm cluster-analysis


    【解决方案1】:

    你的想法行不通。如果对于集群中的所有(data[i], data[j]) 对,它们的距离小于给定的epsilon,则意味着该集群的所有成员都位于以epsilon 为半径的圆中。因此,这种聚类方法不能一概而论。

    顺便说一下,DBSCAN 是一种很好的聚类算法,可以根据给定epsilon 的密度确定聚类。您可以通过添加更强的约束来修改此算法:

    如果每个数据与集群所有成员的距离小于给定的epsilon,则可以将其添加到集群中。

    【讨论】:

      猜你喜欢
      • 2019-04-28
      • 2010-10-25
      • 1970-01-01
      • 1970-01-01
      • 2018-08-04
      • 2020-06-18
      • 2013-11-26
      • 2018-07-24
      • 2011-03-29
      相关资源
      最近更新 更多