【问题标题】:Pearson correlation coefficient in R's survey packageR的调查包中的皮尔逊相关系数
【发布时间】:2016-03-28 21:26:40
【问题描述】:

对不起,如果这真的很明显,但我看不出如何在调查包中的两个变量之间进行简单的 Pearson 相关。我的数据有分层,所以它相当于在 apistrat 中为 api00 和 api99 找到 r。

library(survey)
data(api)

dstrat <- svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)

我确定一定有一种简单的方法可以使用 svyvar 或 svyglm 或其他东西,但我看不到它?

【问题讨论】:

  • cor(apistrat$api00, apistrat$api99) [1] 0.9741931 默认为皮尔逊相关。
  • 谢谢,但我认为这不会考虑到地层或权重。这就是为什么我希望在调查包中有所收获。
  • wtd.cor 在 weights 包中可能会完成这项工作,但我不确定。它也无助于更复杂的抽样设计。调查包中的某些内容肯定是最方便的选择。

标签: r correlation survey


【解决方案1】:

您可以使用svyvar 估计方差-协方差矩阵,然后将其缩放到相关性:

library(survey)
data(api)

dstrat <- svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
v <- svyvar(~api00+api99, dstrat)

as.matrix(v)
cov2cor(as.matrix(v))

这适用于任何数量的相关性和任何设计。

【讨论】:

  • 谢谢托马斯,这要简单得多
  • 如何扩展此方法以获得相关性的置信区间? @ThomasLumley
【解决方案2】:
library(survey)
data(api)
dstrat<-svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
summary(svyglm(api00~ell+meals+mobility, design=dstrat),correlation=T)

【讨论】:

  • 嗨,据我所知,svychisq 是对交叉制表的分类数据进行关联测量?我追求两个连续变量的相关系数。
  • 感谢安东尼的编辑。你能详细说明一下吗?例如,您将如何指定模型以获取 api00 和 api99 之间的相关性?无论是否使用权重和分层,这应该接近 1,但我无法使用这种方法得到任何看起来正确的东西。
  • summary(svyglm(api99~api00, design=dstrat),correlation=T)
  • 恐怕我仍然看不到这两个变量之间的 Pearson 相关性。从 api00 的回归系数和未加权的相关性来看,我预计它会接近 1。
  • 它说系数的相关性:(截距)api00 -0.98
【解决方案3】:

我一直在思考这个问题,我开始认为最好的方法可能是先缩放这两个变量,大概使用 svymean 和 svyvar。

dstrat2 <- transform(dstrat, 
                     z_api99 = (api99 - svymean(~api99,    dstrat))/sqrt(svyvar(~api99, dstrat)), 
                     z_api00 = (api00 - svymean(~api00, dstrat))/sqrt(svyvar(~api00, dstrat))) 

svyglm(z_api99 ~ z_api00, dstrat2)$coefficients

这给出了 9.759047e-01,结果与使用相同:

library(weights)
wtd.cor(apistrat$api99, apistrat$api00, weight = apistrat$pw)

它的优点是几乎可以与任何调查设计类型一起使用。如果有更多变量,它还提供了一种获取标准化 beta 系数的方法。这不是我对原始问题所追求的,但如果没有特定的选项,它可能是最好的方法。

如果其他人可以确认这是否有效,或者是否有更好的方法,那么我将非常感谢任何进一步的 cmets。

【讨论】:

    猜你喜欢
    • 2021-08-29
    • 1970-01-01
    • 1970-01-01
    • 2011-09-10
    • 2016-08-12
    • 1970-01-01
    • 2011-09-13
    • 2013-10-12
    • 1970-01-01
    相关资源
    最近更新 更多