【发布时间】:2015-02-03 09:29:37
【问题描述】:
我正在进行一项调查,共有 288 个观察结果(使用了 108 个完整答案)和大约 200 个变量。 我正在使用 R. 使用主成分分析来减少这些数字。
假设 3 个项目(加载到称为 tmtformalizM 的子数据集)理论上应该减少到一个组件(来自文献回顾),7 点李克特量表。 这是在相关矩阵上提取 PCA,并结合正交旋转(varimax):
Principal Components Analysis
Call: principal(r = tmtformalizM, nfactors = 2, rotate = "varimax",
scores = T)
Standardized loadings (pattern matrix) based upon correlation matrix
RC1 RC2 h2 u2
invapproccio 0.89 -0.11 0.81 0.19
invformacomunic 0.60 0.53 0.64 0.36
verbali -0.07 0.91 0.84 0.16
RC1 RC2
SS loadings 1.16 1.12
Proportion Var 0.39 0.37
Cumulative Var 0.39 0.76
Proportion Explained 0.51 0.49
Cumulative Proportion 0.51 1.00
Test of the hypothesis that 2 components are sufficient.
The degrees of freedom for the null model are 3 and the objective function was 0.09
The degrees of freedom for the model are -2 and the objective function was 0.74
The total number of observations was 108 with MLE Chi Square = 77.17 with prob < NA
Fit based upon off diagonal values = -0.86
提取显示 2 个组件(并且非常适合,这怎么可能是负面的?)。 具有前两项的第一个 PCA 的 Cronbach's alpha 非常低 (0.35)。
我的问题是:在这种情况下,我需要删除分析确定的第一个组成部分,但我应该保留第 3 项(PCA 之后)的分数还是第 3 项的原始调查值作为最终变量?
另外,考虑一个 PCA 的情况,其中提取了 2 个组件(每个组件包含 3 个项目),第一个组件的可靠性非常低(第二个组件的 Alpha > 0.8)。
在这种情况下,我只需要对第二个组件标识的项目重新执行 PCA,并将这些分数作为最终变量,还是只保留第一个 PCA 标识的第二个组件的分数?
谢谢
【问题讨论】:
-
这更像是一个统计问题而不是编程问题,不是吗?
-
是的,你是对的,我发现的唯一编程问题是如何实际删除低可靠性组件......但确实你是对的,主要是理论上的
-
我同意这并不容易,因为您使用的是 R,但问题主要是统计的。
标签: r pca reduction reliability