【发布时间】:2014-11-16 06:33:13
【问题描述】:
找到两个非常大的矩阵的特征向量的余弦相似度,比较它们的相似度是否有效?
我有两个非常大的矩阵 A 和 B。我发现:
-> 协方差矩阵 CA 和 CB,
-> CA和CB的前20个特征向量,
-> 前 20 个特征向量之间的余弦相似度。
根据余弦值得出矩阵 A 和 B 相似/不相似的结论是否正确?
【问题讨论】:
标签: matrix linear-algebra eigenvector cosine-similarity
找到两个非常大的矩阵的特征向量的余弦相似度,比较它们的相似度是否有效?
我有两个非常大的矩阵 A 和 B。我发现:
-> 协方差矩阵 CA 和 CB,
-> CA和CB的前20个特征向量,
-> 前 20 个特征向量之间的余弦相似度。
根据余弦值得出矩阵 A 和 B 相似/不相似的结论是否正确?
【问题讨论】:
标签: matrix linear-algebra eigenvector cosine-similarity
简短回答:不,您当然还必须考虑特征值。
如果您将 N×N 方阵视为将 N 向量映射为 N 向量的线性算子,则矩阵在此类向量空间上的作用会受到矩阵的整个谱结构的强烈影响:特征向量和相关的特征值。
最大的特征值通常是最重要的,因为它们代表了 N 向量空间中矩阵更敏感的方向(特征向量)。
在一个好的情况下,一个大矩阵的谱(即它的特征值的集合)可以很好地分离成几个最大的特征值和很多小的特征值。在这种情况下,可以根据这样的一组主要特征值和相关的特征向量来定义相似度的度量。
以我自己的经验举个例子,对于弹性结构建模产生的矩阵,这确实是典型情况,因为主要的特征值/特征向量“浓缩”了弹性结构的整体属性。
话虽如此,对于特定病例的病态严重程度没有限制。 这在很大程度上取决于所考虑的具体问题,在我看来,“矩阵相似性”的自信假设很大程度上是由物理洞察力驱动的 关于问题。
定义“相似”矩阵的其他流行标准基于奇异值分解 (SVD) 或主成分分析 (PCA)。
【讨论】: