【发布时间】:2015-05-16 04:14:51
【问题描述】:
我在 R 中有一个数据框,由两列组成:“基因”和“表达”。它有一些基因的重复行,但是这些重复的条目具有不同的表达式值。我想压缩重复的行,所以每个基因只有一行,并且这一行具有最大的“绝对”表达式值。示例如下:
对于这个数据框...
df <- data.frame(Gene=c("AKT","MYC","MYC","RAS","RAS","RAS","TP53"),
Expression=c(3,2,6,1,-4,-1,-3))
Gene Expression
1 AKT 3
2 MYC 2
3 MYC 6
4 RAS 1
5 RAS -4
6 RAS -1
7 TP53 -3
我想要这个输出..
Gene Expression
1 AKT 3
2 MYC 6
3 RAS -4
4 TP53 -3
我可以使用识别重复的基因
duplicated(df$Gene)
但我不确定如何排除那些较小绝对值的重复项。
Ps - 我是这个 R malarkey 的新手..
【问题讨论】:
标签: r dataframe duplicates conditional