【发布时间】:2020-03-15 00:25:54
【问题描述】:
我需要将一个基因与 47,000 个其他基因相关联,以找到 10 条最佳相关曲线。 通常,我的数据框在第一列中包含基因名称,在下一列中包含患者数据,在第一行中包含基因名称。我是否需要转置数据框来进行相关测试?如果我转置,它可以工作,但我相信有一种更简单的方法可以做到这一点。有人可以帮帮我吗?
pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)
vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)
library(tidyverse)
df_cor %>%
arrange(cor)
df_cor %>%
arrange(desc(cor)) %>%
head(n = 10)
【问题讨论】:
标签: r correlation