【发布时间】:2012-09-13 02:36:38
【问题描述】:
我有一个关键字之间相似性较大的 csv,我想将其转换为三角距离矩阵(因为它非常大并且稀疏会更好)以使用 scipy 执行层次聚类。我当前的数据 csv 看起来像:
a, b, 1
b, a, 1
c, a, 2
a, c, 2
我不知道该怎么做,也找不到任何简单的 Python 集群教程。
感谢您的帮助!
【问题讨论】:
标签: python matrix bigdata hierarchical-clustering