【发布时间】:2022-01-01 06:08:12
【问题描述】:
是否有任何可用的分层凝聚聚类实现(在 Python 中)可以保留数据点的顺序?例如,我想要这样的输出。
(((seg1, seg2), (seg3, seg4)), seg5)
但不是这样
(((seg1, seg5), (seg2, seg3)), seg4)
【问题讨论】:
-
你知道这会弄乱聚类图吗?例如,
Segment1和Segment14将被分开放置,即使它们在层次上很接近。 可能有办法以这种方式呈现数据,但至少可以说生成的图表会令人困惑。 -
@jfaccioni,上图是一个例子。我有一本小说(书),我喜欢根据一些条件将它按顺序分段。之后,我想根据相似性对连续的段进行分组,我不想对不连续的段进行分组。
标签: python hierarchical-clustering