两个不同矩阵的特征向量的余弦相似度答案

【问题标题】：Cosine Similarity of Eigen Vectors of two different matrices两个不同矩阵的特征向量的余弦相似度
【发布时间】：2014-11-16 06:33:13
【问题描述】：

找到两个非常大的矩阵的特征向量的余弦相似度，比较它们的相似度是否有效？

我有两个非常大的矩阵 A 和 B。我发现：

-> 协方差矩阵 C_A 和 C_B,

-> C_A和C_B的前20个特征向量，

-> 前 20 个特征向量之间的余弦相似度。

根据余弦值得出矩阵 A 和 B 相似/不相似的结论是否正确？

【问题讨论】：

【解决方案1】：

简短回答：不，您当然还必须考虑特征值。

如果您将 N×N 方阵视为将 N 向量映射为 N 向量的线性算子，则矩阵在此类向量空间上的作用会受到矩阵的整个谱结构的强烈影响：特征向量和相关的特征值。

最大的特征值通常是最重要的，因为它们代表了 N 向量空间中矩阵更敏感的方向（特征向量）。

在一个好的情况下，一个大矩阵的谱（即它的特征值的集合）可以很好地分离成几个最大的特征值和很多小的特征值。在这种情况下，可以根据这样的一组主要特征值和相关的特征向量来定义相似度的度量。

以我自己的经验举个例子，对于弹性结构建模产生的矩阵，这确实是典型情况，因为主要的特征值/特征向量“浓缩”了弹性结构的整体属性。

话虽如此，对于特定病例的病态严重程度没有限制。这在很大程度上取决于所考虑的具体问题，在我看来，“矩阵相似性”的自信假设很大程度上是由物理洞察力驱动的关于问题。

定义“相似”矩阵的其他流行标准基于奇异值分解 (SVD) 或主成分分析 (PCA)。

【讨论】：

参加聚会有点晚了，但答案是 +1。你能详细说明最后一句话吗？您的意思是 SVD 或 PCA 可以用于这样的比较吗？如果是，那怎么办？
您可以使用奇异值而不是特征值。
我也有类似的目标。对于 2 个不同的矩阵（A，B），我有 2 组前 200 个主要特征向量。在特征向量集上使用余弦相似度是否有效？我正在考虑在排除对角线后将余弦相似度矩阵的 frobenius 范数作为误差/相异度的度量 ....