【问题标题】:Similarity Metric using numpy使用 numpy 的相似度度量
【发布时间】:2020-10-14 01:24:30
【问题描述】:

我正在尝试根据 Jaccard 相似度得分来定义我自己的相似度度量。我在 jaccard 度量中唯一想要的额外的东西是如果也考虑标签的频率。为此,我编写了这段代码 sn-p:

u = [12,0,3]
v = [24,6,1]
num = 0
den = 0
for i in range(3):
    if u[i]!=0 and v[i] != 0:
        num+=(u[i]+v[i])
    den+=(u[i]+v[i])
print(1 - num/den)

所以我的问题是

  1. 这可以通过 numpy 的位运算符来完成吗?
  2. 还有其他我可以使用的相似度指标吗?我试过余弦相似度。哪个更有帮助?

【问题讨论】:

    标签: python numpy metrics similarity


    【解决方案1】:

    一种使用numpy的向量化函数的方法:

    arr = np.array([u,v])
    
    s = arr.sum(0)
    (s*(arr==0).any(0)).sum()/s.sum()
    

    输出:

    0.13043478260869565
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-03-27
      • 2011-07-03
      • 2013-05-05
      • 1970-01-01
      • 2017-06-13
      • 1970-01-01
      相关资源
      最近更新 更多