【发布时间】:2020-07-31 01:29:27
【问题描述】:
如果两个数据项的分离小于某个用户指定的截止值,那么将两个数据项简单地放入同一个簇中的好的聚类算法是什么?
即X_clustering(data, distance, epsilon) 的结果是一组簇分配,因此对于任何对 i,j,如果 distance(data[i], data[j]) < epsilon,它们在同一个簇中。如果distance(data[i], data[j]) >= epsilon 它们可以在不同的集群中(如果没有其他数据最终将它们联系起来......)。
另一种说法是:如果存在[i, x, y, z..., j]通过数据的路径,则i,j在同一个集群中,使得每个步骤都是distance<epsilon,如果不存在这样的路径,它们在不同的集群中.
【问题讨论】:
标签: algorithm cluster-analysis