【发布时间】:2018-02-05 17:39:25
【问题描述】:
我正在与一个团队合作,有些人正在使用 SPSS 替换缺失的案例(多重插补),然后分析数据。当 SPSS 估算新值时,它会报告每个数据集结果和一个汇总结果,这与所有结果的平均值不同。
现在,我正在使用 R 来处理在 SPSS 上创建的“多重插补数据集”。我正在尝试以与 SPSS 报告相同的方式从回归中获取 汇总估计。 Grace to this post here,我可以使用 broom 包运行多个回归模型并显示每个估计值。问题:一些统计数据是不同的。例如,使用扫帚时的 t 值高于 SPSS 报告的值。 请看一下这个 SPSS 输出。
为了简化这项工作,假设我想对每个 group 的 stars 回归 price,然后显示一个汇总估计值(t 检验结果和 p 值)的行。
代码:
library(broom)
d <- data.frame(group=rep(1:5, each = 20),
price=rnorm(100,1000,10),
stars=rnorm(100,3,1))
fitted_models <- d %>%
group_by(group) %>%
do(model = lm(price ~ stars, data = .))
fitted_models %>% tidy(model)
fitted_models %>% glance(model)
如果您想更好地了解 SPSS 在做什么,请检查此实际输出。汇总并不是所有结果的平均值。
请随意说这个问题无关紧要,但不要否定这篇文章。其他人可能有同样的问题,我提供所有代码给你再次运行分析。
非常感谢
【问题讨论】:
-
我认为您有两个不属于一起的问题。第一个是,“SPSS 在计算“Pooled”结果时在做什么?”这是 CrossValidated 的问题,而不是 Stack Overflow 的问题。第二个问题是“我如何在 R 中做 XYZ”?这可能是 SO 的一个问题,具体取决于 XYZ 究竟是什么。
-
你说得对,@CurtF。我将这两个问题合并为一个问题,这可能不是最好的主意。
标签: r regression spss broom