【问题标题】:PCA item deletionPCA 项目删除
【发布时间】:2015-02-03 09:29:37
【问题描述】:

我正在进行一项调查,共有 288 个观察结果(使用了 108 个完整答案)和大约 200 个变量。 我正在使用 R. 使用主成分分析来减少这些数字。

假设 3 个项目(加载到称为 tmtformalizM 的子数据集)理论上应该减少到一个组件(来自文献回顾),7 点李克特量表。 这是在相关矩阵上提取 PCA,并结合正交旋转(varimax):

Principal Components Analysis
Call: principal(r = tmtformalizM, nfactors = 2, rotate = "varimax", 
scores = T)
Standardized loadings (pattern matrix) based upon correlation matrix
                  RC1   RC2   h2   u2
invapproccio     0.89 -0.11 0.81 0.19
invformacomunic  0.60  0.53 0.64 0.36
verbali         -0.07  0.91 0.84 0.16

                       RC1  RC2
SS loadings           1.16 1.12
Proportion Var        0.39 0.37
Cumulative Var        0.39 0.76
Proportion Explained  0.51 0.49
Cumulative Proportion 0.51 1.00

Test of the hypothesis that 2 components are sufficient.

The degrees of freedom for the null model are  3  and the objective function      was  0.09
The degrees of freedom for the model are -2  and the objective function was     0.74 
The total number of observations was  108  with MLE Chi Square =  77.17  with prob <  NA 

Fit based upon off diagonal values = -0.86

提取显示 2 个组件(并且非常适合,这怎么可能是负面的?)。 具有前两项的第一个 PCA 的 Cronbach's alpha 非常低 (0.35)。

我的问题是:在这种情况下,我需要删除分析确定的第一个组成部分,但我应该保留第 3 项(PCA 之后)的分数还是第 3 项的原始调查值作为最终变量?

另外,考虑一个 PCA 的情况,其中提取了 2 个组件(每个组件包含 3 个项目),第一个组件的可靠性非常低(第二个组件的 Alpha > 0.8)。

在这种情况下,我只需要对第二个组件标识的项目重新执行 PCA,并将这些分数作为最终变量,还是只保留第一个 PCA 标识的第二个组件的分数?

谢谢

【问题讨论】:

  • 这更像是一个统计问题而不是编程问题,不是吗?
  • 是的,你是对的,我发现的唯一编程问题是如何实际删除低可靠性组件......但确实你是对的,主要是理论上的
  • 我同意这并不容易,因为您使用的是 R,但问题主要是统计的。

标签: r pca reduction reliability


【解决方案1】:

如果你认为这三个项目应该组成一个组件,你为什么要提取 2?了解拟合问题,查看解决方案的残差。 图书馆(心理) pc1

我不明白你的第二个问题。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-10-19
    • 2013-07-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多