【问题标题】:Calculate correlation between multiple vairables in a data frame计算数据框中多个变量之间的相关性
【发布时间】:2021-05-10 14:16:29
【问题描述】:

使用内置的 R 数据集 mtcars,我想在数据框中的选定变量之间创建一个相关表,即 mpg 和 disp、mpg 和 hp、mpg 和 wt、disp 和 hp、disp 和 wt、hp和重量。我还希望表格显示 p 值。

                   mpg disp  hp drat    wt  qsec
Mazda RX4         21.0  160 110 3.90 2.620 16.46
Mazda RX4 Wag     21.0  160 110 3.90 2.875 17.02
Datsun 710        22.8  108  93 3.85 2.320 18.61
Hornet 4 Drive    21.4  258 110 3.08 3.215 19.44
Hornet Sportabout 18.7  360 175 3.15 3.440 17.02
Valiant           18.1  225 105 2.76 3.460 20.22

【问题讨论】:

  • 那么你能发布一个预期的输出格式吗?
  • @AnilGoyal 以列和行为变量的两张表,一张显示相关系数,另一张显示p值

标签: r correlation


【解决方案1】:

你可以使用Hmisc这样的包

library(Hmisc)

#Create the data
df <- subset(mtcars, select = c("mpg", "disp",  "hp", "drat", "wt", "qsec"))

#Calculate correlation using base R
round(cor(df),2)

#Calculate correlation using Hmisc package
rcorr(as.matrix(df), type=c("pearson"))

【讨论】:

  • 谢谢!如何获取 p 值以检查相关系数的显着性?
  • 你跑过rcorr(as.matrix(df), type=c("pearson"))吗?它为您提供相关性和 p 值。第一个输出是相关性,第二个是 p 值。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-02-14
  • 1970-01-01
  • 2020-07-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多