【发布时间】:2023-03-22 05:14:01
【问题描述】:
我有一个数据框,其中包含每个样本中是否存在蛋白质序列,每一行是不同的样本,每列是蛋白质序列,除了最后一列对每个样本进行分组分配。
如下所示:
df <- data.frame(c(0,1,1,1,0,0), c(0,1,0,1,0,1), c(1,0,1,0,0,0), c(0, 0,0,1,1,1)
rownames(df) <- c(“AA”, “AB”, “AC”, “STATUS”)
我想计算每个蛋白质序列(列)的 p 值,以参考相同的状态(最后一列)进行 Fisher 精确检验。我的实际数据集有超过 100000 列,所以我需要一个有效的解决方案。
我面临的挑战是将其输入到每个蛋白质序列的权变矩阵中,以便输入到 Fisher.test 中。完成此操作后,可以对除最后一列之外的所有列进行循环,但我不确定这是最有效的方法。
【问题讨论】:
标签: r