【发布时间】:2014-04-06 23:50:52
【问题描述】:
我一直在寻找如何有效地实现用于描述层次聚类的树状图。目前我使用正则表达式来解析和显示它,如下所示。
[[2,1],[3]]
这意味着存在三个文档,级别 1 包含两个集群,一个包含文档 2 和 1,另一个仅包含文档 3。 当我们在特定级别切割树状图后得到簇。剪切显示的正则表达式很困难,并且并不总是给出正确的簇。
我们应该使用什么数据结构和表示,以便从树状图中获取集群相对容易。
【问题讨论】:
标签: machine-learning artificial-intelligence data-mining cluster-analysis hierarchical-clustering