将变量与 r 中的多个变量相关联答案

【问题标题】：correlate a variable with multiple variables in r将变量与 r 中的多个变量相关联
【发布时间】：2020-03-15 00:25:54
【问题描述】：

我需要将一个基因与 47,000 个其他基因相关联，以找到 10 条最佳相关曲线。通常，我的数据框在第一列中包含基因名称，在下一列中包含患者数据，在第一行中包含基因名称。我是否需要转置数据框来进行相关测试？如果我转置，它可以工作，但我相信有一种更简单的方法可以做到这一点。有人可以帮帮我吗？

pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)

vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)

library(tidyverse)

df_cor %>%
  arrange(cor)

df_cor %>%
  arrange(desc(cor)) %>% 
  head(n = 10)

【问题讨论】：

标签： r correlation

【解决方案1】：

如果你想计算基因之间的相关性（数据框中的行），你需要转置你的数据框，试试这个基因之间的相关性

correlation_btw_genes = cor(pancreas_final_t)

如果你不转置你的数据框 cor() 函数将计算你的病人之间的相关性

【讨论】：

如果我尝试在我的计算机无法处理的所有基因之间建立关联，我没有足够的内存来做这件事。幸运的是，我只需要将一个变量与所有其他变量关联起来……