【发布时间】:2019-04-13 04:46:12
【问题描述】:
我有 2 个数据行,每个数据行有 4 个字段
类似这样的:
field1 field2 field3 field4
Row 1
Row 2
现在我必须比较这两条记录并计算相似度。我通过导出余弦相似度来计算每个字段的相似度。
所以我最终会得到类似这样的相似之处: (0 表示一周相似度,1 表示高度相似度)
field1: 0.12
field2: 0.67
field3: 1.00
field3: 0.93
我现在可以通过平均该值找到总相似度,但问题是:
我想为字段添加权重
所以如果field2的权重高于field1,那么field2的相似度将对平均相似度有显着贡献。
你能推荐一个公式或算法来满足这样的要求吗?
【问题讨论】:
标签: algorithm