【问题标题】:correlate a variable with multiple variables in r将变量与 r 中的多个变量相关联
【发布时间】:2020-03-15 00:25:54
【问题描述】:

我需要将一个基因与 47,000 个其他基因相关联,以找到 10 条最佳相关曲线。 通常,我的数据框在第一列中包含基因名称,在下一列中包含患者数据,在第一行中包含基因名称。我是否需要转置数据框来进行相关测试?如果我转置,它可以工作,但我相信有一种更简单的方法可以做到这一点。有人可以帮帮我吗?

pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)

vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)

library(tidyverse)

df_cor %>%
  arrange(cor)

df_cor %>%
  arrange(desc(cor)) %>% 
  head(n = 10)

【问题讨论】:

    标签: r correlation


    【解决方案1】:

    如果你想计算基因之间的相关性(数据框中的行),你需要转置你的数据框,试试这个基因之间的相关性

    correlation_btw_genes = cor(pancreas_final_t)
    

    如果你不转置你的数据框 cor() 函数将计算你的病人之间的相关性

    【讨论】:

    • 如果我尝试在我的计算机无法处理的所有基因之间建立关联,我没有足够的内存来做这件事。幸运的是,我只需要将一个变量与所有其他变量关联起来……
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-10-10
    • 1970-01-01
    • 1970-01-01
    • 2014-04-15
    • 2020-05-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多