PCA 项目删除答案

【问题标题】：PCA item deletionPCA 项目删除
【发布时间】：2015-02-03 09:29:37
【问题描述】：

我正在进行一项调查，共有 288 个观察结果（使用了 108 个完整答案）和大约 200 个变量。我正在使用 R. 使用主成分分析来减少这些数字。

假设 3 个项目（加载到称为 tmtformalizM 的子数据集）理论上应该减少到一个组件（来自文献回顾），7 点李克特量表。这是在相关矩阵上提取 PCA，并结合正交旋转（varimax）：

Principal Components Analysis
Call: principal(r = tmtformalizM, nfactors = 2, rotate = "varimax", 
scores = T)
Standardized loadings (pattern matrix) based upon correlation matrix
                  RC1   RC2   h2   u2
invapproccio     0.89 -0.11 0.81 0.19
invformacomunic  0.60  0.53 0.64 0.36
verbali         -0.07  0.91 0.84 0.16

                       RC1  RC2
SS loadings           1.16 1.12
Proportion Var        0.39 0.37
Cumulative Var        0.39 0.76
Proportion Explained  0.51 0.49
Cumulative Proportion 0.51 1.00

Test of the hypothesis that 2 components are sufficient.

The degrees of freedom for the null model are  3  and the objective function      was  0.09
The degrees of freedom for the model are -2  and the objective function was     0.74 
The total number of observations was  108  with MLE Chi Square =  77.17  with prob <  NA 

Fit based upon off diagonal values = -0.86

提取显示 2 个组件（并且非常适合，这怎么可能是负面的？）。具有前两项的第一个 PCA 的 Cronbach's alpha 非常低 (0.35)。

我的问题是：在这种情况下，我需要删除分析确定的第一个组成部分，但我应该保留第 3 项（PCA 之后）的分数还是第 3 项的原始调查值作为最终变量？

另外，考虑一个 PCA 的情况，其中提取了 2 个组件（每个组件包含 3 个项目），第一个组件的可靠性非常低（第二个组件的 Alpha > 0.8）。

在这种情况下，我只需要对第二个组件标识的项目重新执行 PCA，并将这些分数作为最终变量，还是只保留第一个 PCA 标识的第二个组件的分数？

谢谢

【问题讨论】：

这更像是一个统计问题而不是编程问题，不是吗？
是的，你是对的，我发现的唯一编程问题是如何实际删除低可靠性组件......但确实你是对的，主要是理论上的
我同意这并不容易，因为您使用的是 R，但问题主要是统计的。

标签： r pca reduction reliability

【解决方案1】：

如果你认为这三个项目应该组成一个组件，你为什么要提取 2？了解拟合问题，查看解决方案的残差。图书馆（心理） pc1

我不明白你的第二个问题。

【讨论】：