【发布时间】:2018-06-16 10:02:46
【问题描述】:
我计算了类似于以下的数据帧的余弦相似度:
ciiu4n4 A0111 A0112 A0113
A0111 14 7 6
A0112 16 55 3
A0113 15 0 112
使用此代码:
data_cosine = mpg_data.drop(['ciiu4n4'], axis=1)
result = cosine_similarity(data_cosine)
我得到一个这样的数组:
[[ 1. 0.95357118 0.95814892 ]
[ 0.95357118 1. 0.89993795 ]
[ 0.95814892 0.89993795 1. ]]
但是,我需要将结果作为类似于原始数据框的数据框。我不能手动做,因为原始数据框是 600 x 600。
我需要的结果看起来类似于:
ciiu4n4 A0111 A0112 A0113
A0111 1. 0.95357118 0.95814892
A0112 0.95357118 1. 0.89993795
A0113 0.95814892 0.89993795 1.
【问题讨论】:
标签: python pandas dataframe cosine-similarity