【发布时间】:2015-12-14 07:29:07
【问题描述】:
计算完每个元素之间的距离后,下一步应该如何创建完整链接方法的树状图?
【问题讨论】:
标签: cluster-analysis hierarchical-clustering
计算完每个元素之间的距离后,下一步应该如何创建完整链接方法的树状图?
【问题讨论】:
标签: cluster-analysis hierarchical-clustering
假设我们有 6 个数据项 i1、i2、i3、i4、i5、i6,它们的距离应如下图所示。
i1 i2 i3 i4 i5 i6
---------------------------------------------
i1 -
i2 d1.2 -
i3 d1.3 d2.3 -
i4 d1.4 d2.4 d3.4 -
i5 d1.5 d2.5 d3.5 d4.5 -
i6 d1.6 d2.6 d3.6 d5.6 d5.6 -
完整的链接意味着最远的邻居。所以这应该在树状图中表达。树状图中纵轴的最后一个值将是最长的距离。
首先取距离最小的一对。如果有不止一对具有相同的距离值,只需从您第一次遇到的那对开始。 [希望逐行获取第一对遇到的第一对]然后将树状图中的这两对与垂直轴上的距离值合并。 [绘制树状图时,最好不要在开始时标记轴值。在整个过程中给它们贴上标签,这样你就可以避免重叠的线条。]
然后去下一对。如果这个新对影响树状图中已经存在的对,请检查可以建立的对的距离是否比新对距离的值更高。如果是这样,请忽略新对并继续下一步。如果不是,您可以在树状图中将它们与垂直轴上的距离值合并。
例如:
所以 i2 和 i3 在纵轴 d2.3 的值处合并到树状图中。 下一对 (i3,i4) 影响已经在树状图中的 i3,如果合并,它可以构建另一对 (i2,i4)。由于它的距离 d2.4 远高于 d3.4,所以现在可以忽略这对新的对 (i3,i4) 而无需合并。
同样,您可以绘制树状图,以最远距离值描绘最远邻居。
【讨论】: