【发布时间】:2019-05-21 17:50:02
【问题描述】:
我想在 tidyverse 中获得跨多个变量的相关矩阵。但是,我想按另一列分组。例如。假设我有一个数据框 df 和列 year,我想查看 V1、V2、V3 之间的相关性。
year V1 V2 V3 misc_var
2018 5 6 5 a
2018 4 6 4 b
2018 3 2 3 NA
2013 5 8 2 4
2013 6 3 8 8
2013 4 7 5 NA
我试过了。沿着
cor_output = df %>%
group_by(year) %>%
select(V1, V2, V3, year) %>%
cor(use = "pairwise.complete.obs")
但是,它不是计算每年从 V1 到 V3 的相关性,而是将year 变量添加到相关性中。
所需的输出应该是这样的(请注意输出中的相关性是组成的)
year var V1 V2 V3
2013 V1 1 0.7 0.3
2013 V2 ... 1 ...
...
...
2018 V2 0.6 1 0.7
...
有什么想法吗?
【问题讨论】:
标签: r correlation tidyverse