一 . p范数
向量的长度,也叫向量的范数,p范数定义了距离,kmeans 长度的扩展:(a**p+b**p+c**p)**(1/p)

二. 向量a和向量b的内积(点积)
a·b = a1*b1+a2*b2+a3*b3=|a|*|b|cosq
物理意义:点积反映了2个向量共振的程度

三. 向量的投影
Proj.u = (u·v)/|v|
物理意义:向量u在向量v上的投影
线性代数一(向量)

四.cos相似度的计算公式:cosq = (u·v) / (|u|*|v|)
cosq的值越大,表明相似度越大。
两个向量的cos相似度越大,两个向量就越相似
线性代数一(向量)
线性代数一(向量)
cos相似度的问题:当用户的评分尺度不一样时,就无法正确反映有用的信息,这就想到Pearson相似度

五. Pearson相似度
又叫Pearson相关系数,correlation coefficient
线性代数一(向量)

Pearson相似度的计算步骤:
1. 中心化
2. 计算cos相似度

Pearson相似度在线性变换下,保持不变

线性相关和线性独立的定义
线性代数一(向量)

结论:只有n个独立向量,才能张成一个n维的向量空间。

六. 向量组的秩rank:向量组所含的最大数目的独立向量。
应用:
逻辑回归,线性回归,特征的选取,去除冗余的特征

相关文章:

  • 2021-09-08
  • 2021-04-19
  • 2021-09-15
  • 2021-10-27
  • 2021-11-19
  • 2021-04-19
  • 2021-08-28
  • 2021-04-07
猜你喜欢
  • 2021-10-19
  • 2022-01-05
  • 2021-08-15
  • 2021-11-28
  • 2022-12-23
  • 2021-04-04
  • 2021-11-09
相关资源
相似解决方案