【发布时间】:2018-02-22 17:07:44
【问题描述】:
我有一个包含 10 列和 2000 行的数据框。我的示例数据如下所示:
rs_id Code Combination_Ag A.Ag Combination_Bg B.Ag Combination_Cg C.Ag
rs_1 0 1:01/1:01 1 13:02/13:02 1 03:04/03:04 6 1:01/1:01 1
rs_1 0 1:01/11:01 2 13:02/49:01 2 03:04/15:02 1 1:01/15:01 1
rs_1 1 1:01/2:01 6 13:02/57:01 1 03:04/7:01 2 1:01/3:01 1
rs_1 2 1:01/2:05: 1 13:02/8:01 1 06:02/06:02 3 1:01/4:04 1
rs_1 2 1:01/24:02 3 14:01/14:02 1 06:02/15:02 1 1:01/4:04 3
rs_2 0 1:01/3:01 1 14:01/7:02 1 06:02/2:02: 1 1:01/4:07 1
rs_2 1 1:01/31:01 1 15:01/15:01 1 06:02/3:03 1 1:01/7:01 2
rs_2 1 11:01/2:01 4 15:01/18:01 1 06:02/3:04 1 10:01/14:01 1
rs_2 2 11:01/25:01 1 15:01/44:02 2 06:02/4:01 1 10:01/3:01 5
我正在尝试找到 rs_id =0、1 和 2 的最高组合(A.Ag、B.Bg C.Ag)。我怎样才能做到这一点? 输出将是
rs_1 0 1:01/11:01 2 13:02/49:01 2 03:04/03:04 6 1:01/1:01 1
rs_1 1 1:01/2:01 6 13:02/57:01 1 03:04/7:01 2 1:01/3:01 1
rs_1 2 1:01/24:02 3 06:02/06:02 3 06:02/15:02 1 1:01/4:04 3
rs_2 0 1:01/3:01 1 14:01/7:02 1 06:02/2:02: 1 1:01/4:07 1
rs_2 1 11:01/2:01 4 15:01/18:01 1 06:02/3:04 1 10:01/14:01 1
rs_2 2 11:01/25:01 1 15:01/44:02 2 06:02/4:01 1 10:01/3:01 5
【问题讨论】:
-
“Combination_*”列似乎没有自然顺序,因此选择最高的列会带来问题。期望的结果表明您想要最高的 *.Ag 值和关联的组合在同一行和 rs_id 中。
-
@42-对不起。我只需要根据 *.Ag 计数来识别
标签: r data.table sapply