【发布时间】:2017-06-17 21:04:05
【问题描述】:
我有一个项目-项目矩阵 (1877 x 1877)。矩阵中的值表示两个项目一起出现的次数。如何确定两个项目之间的相似性? 通过阅读,我发现很少的选择。但是我不确定这些方法。感谢您对入门的任何投入。
- 使用余弦计算两个向量之间的 sim
- 将其转换为图表,使用 simrank 等度量来计算相似度 - 可以使用出现次数作为两个节点之间的权重。
【问题讨论】:
标签: python matrix cosine-similarity find-occurrences