【问题标题】:What data structures to use for dendrogram?用于树状图的数据结构是什么?
【发布时间】:2014-04-06 23:50:52
【问题描述】:

我一直在寻找如何有效地实现用于描述层次聚类的树状图。目前我使用正则表达式来解析和显示它,如下所示。

[[2,1],[3]]

这意味着存在三个文档,级别 1 包含两个集群,一个包含文档 2 和 1,另一个仅包含文档 3。 当我们在特定级别切割树状图后得到簇。剪切显示的正则表达式很困难,并且并不总是给出正确的簇。

我们应该使用什么数据结构和表示,以便从树状图中获取集群相对容易。

【问题讨论】:

    标签: machine-learning artificial-intelligence data-mining cluster-analysis hierarchical-clustering


    【解决方案1】:

    您可能希望使用 SLINK 算法使用的指针表示。

    这相当简单:对父对象的引用,以及它们加入集群的距离。

    这里是

    2 parent 1   height 1
    1 parent 3   height 2
    3 parent nil height inf
    

    为了提取集群,只需删除所有连接高度过高的边。

    【讨论】:

      猜你喜欢
      • 2011-07-18
      • 2011-05-15
      • 2013-07-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多