【发布时间】:2012-08-16 19:06:09
【问题描述】:
我有一个数据框,其中有两列联系字符串。在一列(名为probes)中,我有重复的案例(即具有相同字符串的多个案例)。对于探测中的每个案例,我想找到包含相同字符串的所有案例,然后将第二列(名为genes)中所有相应案例的值合并为一个案例。
例如,如果我有这样的结构:
probes genes
1 cg00050873 TSPY4
2 cg00061679 DAZ1
3 cg00061679 DAZ4
4 cg00061679 DAZ4
我想改成这样的结构:
probes genes
1 cg00050873 TSPY4
2 cg00061679 DAZ1 DAZ4 DAZ4
显然对于使用 which 的单个探针执行此操作没有问题,然后粘贴和折叠
ind<-which(olap$probes=="cg00061679")
genename<-(olap[ind,2])
genecomb<-paste(genename[1:length(genename)], collapse=" ")
但我不确定如何在整个数据帧中提取探针列中重复项的索引。有什么想法吗?
提前致谢
【问题讨论】:
-
在上述问题的答案中将参数更改为
collapse = " ",您就有了答案。
标签: r duplicates aggregate