【问题标题】:Hierarchical Clustering with branching factor > 2?分支因子> 2的层次聚类?
【发布时间】:2017-10-23 04:19:56
【问题描述】:

我见过的所有在 Python 中实现的层次聚类方法(scipy、scikit-learn 等)一次拆分或组合两个集群。这会强制每个节点的分支因子为 2。出于我的目的,我希望模型允许分支因子大于 2。这在集群之间存在联系的情况下很有帮助。

我不熟悉任何分支因子大于 2 的层次聚类技术;它们存在吗?

【问题讨论】:

  • 欢迎来到 Stack Overflow!我编辑了您问题的标题,以包含有关您问题的更多详细信息——它一般是关于层次聚类,而不是文档聚类。我想向您介绍 UPGMA 和 WPGMA。这些是在 scipy 中实现的(并且包装器存在于 scikit-learn 中),并且它们确实允许绑定。

标签: machine-learning cluster-analysis hierarchical-clustering


【解决方案1】:

用单个链接对这个数据集进行聚类:

0 0
0 1
1 0
1 1

看到一个 4 路合并。

但对于其他链接,总是找到 最佳 3 路拆分可能会将运行时成本增加到 O(n^4)。你真的不想这样。

【讨论】:

    猜你喜欢
    • 2010-09-10
    • 2013-05-08
    • 1970-01-01
    • 2018-10-04
    • 2014-06-28
    • 2016-08-07
    • 1970-01-01
    • 2019-01-27
    • 2018-10-22
    相关资源
    最近更新 更多