【发布时间】:2020-08-24 22:42:30
【问题描述】:
嘿嘿,
我有一个输入文件,该文件有一列带有基因 id,然后有一列带有 GO 术语,每个基因有多行(从 1 到 >20 的任意位置)。我需要生成的格式对于每个唯一的基因 ID 有一行,第二列中的 GO 术语用分号分隔。
我的数据:
GeneID GO
am1001 190909
am1001 600510
am1002 500050
am1002 432323
am1002 100209
想要的输出:
GeneID GO_list
am1001 190909; 600510
am1002 50050; 432323; 100209
我尝试过类似于How to create new columns in a data.frame based on row values in R? 的方法,但没有成功。
提前感谢您的建议! :)
【问题讨论】:
标签: r group-by dplyr transform splitstackshape