【发布时间】:2017-06-28 14:37:49
【问题描述】:
df
Beginning1 Protein2 Protein3 Protein4 Biomarker1
Pathway3 A G NA NA F
Pathway6 A G NA NA E
Pathway1 A B C D F
Pathway2 A B H NA F
Pathway4 A B C D E
Pathway5 A B H NA F
我想对上述数据框 (df) 重新排序,以便在其蛋白质通路中具有最大相似性的通路(也就是 2:4 列中的最大相似性)彼此相邻排序。
为了更清楚,我希望输出如下所示:
newdf
Beginning1 Protein2 Protein3 Protein4 Biomarker1
Pathway6 A G NA NA E
Pathway3 A G NA NA F
Pathway5 A B H NA E
Pathway2 A B H NA F
Pathway4 A B C D E
Pathway1 A B C D F
如何去做呢?我尝试了包括 unique(df) 在内的变体,但到目前为止都没有奏效。
此外,虽然仅按非 NA 字符的数量排序适用于该数据集,但我将分析的实际数据集将包含数百个具有相同步数的路径。
【问题讨论】:
-
不要发布数据图片。将您的数据保存在reproducible format
-
谢谢!我是 Stack Overflow 的新手,不知道如何在问题中输入我的数据框。
-
虽然不是在所有情况下都有效,但您可以使用基本 R
order函数对数据进行排序:例如df[with(df, order(Beginning1, Protein2, Protein3, Protein4)),]。