【发布时间】:2013-05-05 23:39:20
【问题描述】:
这样的向量
v1 = {0 0 0 1 1 0 0 1 0 1 1}
v2 = {0 1 1 1 1 1 0 1 0 1 0}
v3 = {0 0 0 0 0 0 0 0 0 0 1}
需要计算它们之间的相似度。 v1 和 v2 之间的汉明距离是 4,v1 和 v3 之间的汉明距离也是 4。但是因为我对组合在一起的“1”组感兴趣 v2 更类似于v1 然后是v3。
是否有任何距离指标可以在数据中捕捉到这一点?
这些数据及时代表了房屋的入住率,这就是为什么它对我很重要。 '1' 表示占用,'0' 表示未占用。
【问题讨论】:
-
那么问题是什么?
-
抱歉,已经编辑过了,如果有任何距离指标可以捕捉到这一点
-
I am interested in the groups of '1' which are together。你能解释一下你的意思吗?由于组的数量相同,1 和 2 更相似? -
好吧,基本上是的,1 和 2 更相似,有相同数量的组。因为
v2基本上是矢量v1,只有'1' 的first group是“更宽”。V3几乎是空向量
标签: vector data-mining similarity hamming-distance