【发布时间】:2017-11-18 09:59:36
【问题描述】:
我有一个df 喜欢:
SampleID Chr Start End Strand Value
1: rep1 1 11001 12000 - 10
2: rep1 1 15000 20100 - 5
3: rep2 1 11070 12050 - 1
4: rep3 1 14950 20090 + 20
...
我想加入共享相同chr 和strand 并且具有相似起点和终点的行(例如,100 +/- 距离)。对于执行行连接的那些列,我还想连接SampleID 名称和Value。在前面的示例中,类似于:
SampleID Chr Start End Strand Value
1:rep1,rep2 1 11001 12000 - 10,1
2: rep1 1 15000 20100 - 5
4: rep3 1 14950 20090 + 20
...
想法?谢谢!
编辑:
我找到了 R 的模糊连接包 (https://cran.r-project.org/web/packages/fuzzyjoin/index.html)。有人有这个包的经验吗?
EDIT2:
如果只连接其中一个变量(SampleID 或 Value)也很好。
【问题讨论】:
标签: r data.table fuzzyjoin