【问题标题】:principal components of PCAPCA的主要成分
【发布时间】:2019-05-13 10:07:57
【问题描述】:

我在 datacamp.com 上遇到过这个问题:
下面是同一点云的三个散点图。每个散点图显示一组不同的轴(红色)。在哪个图中,坐标轴可以代表点云的主成分?

还记得主成分是数据变化的方向吗?

回答: 情节 1 和 3

我的问题是这个问题是什么意思?为什么图 2 不是答案的一部分,因为轴可以旋转以适合点云。

【问题讨论】:

  • 请只选择与问题相关的语言标签。否则,最好在 Cross Validated 询问。

标签: python pca cross-validation dimensionality-reduction


【解决方案1】:

正如 cmets 中所建议的,这更适合交叉验证,或者可能是 math.stackexchange。

现在答案在直觉上相当简单。

主成分可以通过迭代过程获得:

  1. 第一个主成分等价于线性组合a_1 %*% X 最大化Var(a_1 %*% X) 服从t(a_1) %*% a_1 = 1
  2. 第二个主成分等价于线性组合a_2 %*% X,在t(a_2) %*% a_2 = 1cov(a_1 %*% X, a_2 %*% X) = 0下最大化Var(a_2 %*% X)
  3. 第三个--|| --

从这个定义中注意到var(a_1 %*% X) = var( - a_1 %*% X),因此主成分只被确定为该成分的符号。

从这个定义我们可以看出: 1. 1 和 3 是等价的,因为第一条(最长)线位于点分布最广的方向(显示最大方差) 2.第二个图不能是主成分,因为方向与最大方差的方向不一致

Applied Multivariate Statistical Analysis 中的第 8 章第 430 页(ish)包含更详细的理论解释。

【讨论】:

    【解决方案2】:

    正如@NelsonGon 所提到的,这在 CrossValidated 上可能会更好......但无论如何:

    图 1 和图 3 是正确的,因为它们的坐标轴实际上是在所示平面上最大化方差的坐标轴。向量可以翻转,因为特征向量的符号在 PCA 中是任意的(您会注意到图 1 和图 3 中的红色向量沿着相同的轴,其中一个只是“翻转”)。 然而,情节 2 的向量显然没有沿着最大化点云分布的轴,因此您所指的帖子上的答案。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-10-24
      • 2015-07-29
      • 1970-01-01
      • 1970-01-01
      • 2013-03-31
      • 1970-01-01
      • 2013-03-28
      • 1970-01-01
      相关资源
      最近更新 更多