【发布时间】:2016-11-03 17:53:41
【问题描述】:
我试图找出两个文档的余弦相似度,如下所示:
d1: [(0,1), (3,2), (6, 1)]
d2: [(1,1), (3,1), (5,4), (6,2)]
其中每个文档是一个主题权重向量,其中主题是元组中的第一个元素,权重是第二个元素
我不确定在这种情况下如何使用这种加权方案计算余弦相似度? Python中是否有任何模块/包可以让我做这样的事情?
【问题讨论】:
标签: python scikit-learn cosine-similarity trigonometry