【问题标题】:ELKI hierarchical clustering - "mrg_" Cluster objectELKI 层次聚类——“mrg_”聚类对象
【发布时间】:2016-06-06 09:27:42
【问题描述】:

我将ELKI's SimplifiedHierarchyExtractionAnderbergHierarchicalClusteringLatLngDistanceFunctionminClSize = 100 一起使用。

我看到"clu_" Clusters旁边还有2个-3"mrg_" Clusters,其中有一些DBID's,但数量是< minClSize

我的问题是:处理这个"mrg_" Clusters?的最佳方法是什么:

  • 将其DBID´s 传递给其"clu_" children 之一?
  • 尽管它们在minClSize 下,但仍将它们视为a cluster
  • 只是忽略它们?

【问题讨论】:

    标签: machine-learning cluster-analysis data-mining hierarchical-clustering elki


    【解决方案1】:

    这是一个分层结果。

    您需要将所有子集群包含在一个集群中。

    所以mrg_ 集群有一些(可能是 0 个)新对象,加上子集群中的所有这些对象。特别是它可以有多个子集群(这就是为什么它被称为merge

    【讨论】:

    • 所以你的意思是,如果我有一个 mrg_ 包含 4 个 DBID's 并且有 2 个孩子:one clu_ and another one mrg_,那么我应该考虑一个由所有 clu_ 孩子组成的集群mrg_ 和他的mrg_ child?
    • 是的。所有孩子的所有对象也属于这个集群。我们不存储多余的会员资格。
    • 但是如果我这样做,那么我最终会得到少量的集群。
    • 但是我必须只对包含“min 1 DBID”的“mrg_”集群进行这种“合并”,我错了吗?
    • 这是一个分层结果。不要期望能够将其展平并保留所有属性。如果您进行所有合并,则所有内容都将位于一个根目录中。您需要将其视为一棵树,其中一个簇是另一个簇的一部分。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-06-28
    • 2016-08-07
    • 2019-04-27
    • 2018-10-04
    • 2014-05-18
    • 2013-05-08
    相关资源
    最近更新 更多