【发布时间】:2021-04-30 15:23:48
【问题描述】:
我有以下数据框:
Group Vector
1 [1 1 0 1 0 0]
1 [1 0 0 1 0 0]
1 [1 0 0 1 1 1]
1 [0 0 0 1 0 1]
2 [0 0 0 1 0 1]
2 [0 0 0 1 0 1]
2 [0 1 1 1 0 1]
2 [1 1 0 0 0 1]
如何计算组内的平均余弦相似度?这是预期的结果(注意我为计算补了数字)
Group Vector Average_Similarity
1 [1 1 0 1 0 0] 0.34
1 [1 0 0 1 0 0] 0.34
1 [1 0 0 1 1 1] 0.34
1 [0 0 0 1 0 1] 0.34
2 [0 0 0 1 0 1] 0.48
2 [0 0 0 1 0 1] 0.48
2 [0 1 1 1 0 1] 0.48
2 [1 1 0 0 0 1] 0.48
【问题讨论】:
-
不,我对组相似性感兴趣
-
组中每对向量的余弦相似度平均值?
-
是的,这正是我要找的,所以我可能需要以某种方式遍历行?
-
你的数据在 pandas df 还是什么?
-
是的,最后一列“vector”是一个numpy数组
标签: python pandas cosine-similarity