【发布时间】:2013-12-31 22:35:54
【问题描述】:
1) 我正在使用以下方法来测量两个向量(比如 A 和 B)之间的余弦距离。
假设我们有两个向量,例如向量 A 和向量 B,
A & B 之间的余弦距离 = (dot(A, B) / (Magnitude (A) * Magnitude (B)))
这个公式对吗?如果不是,请建议我正确的公式?
2) K-NN 在准确性上总是比 Rocchio 好,还是在某些情况下 Rocchio 的性能比 K-NN 好? K-NN 看起来像是对 Rocchio 的增强,理论概念表明 K-NN 的性能将比 Rocchio 好得多,但我发现在实际实现中反之亦然,其中 Rocchio 的性能比 K-NN 好得多?
【问题讨论】:
-
您已经正确定义了两个向量之间夹角的余弦,但这不是“距离”:当向量最接近时(在同一方向上),它最大。
标签: machine-learning classification