【发布时间】:2016-10-19 16:30:03
【问题描述】:
我有以下两个文件:
文件1:
4 rs10000009 0 71048953 G A
4 rs10000010 0 21618674 C T
4 rs10000011 0 138223055 T C
2 rs1000001 0 50711642 T G
4 rs10000005 0 85161558 G A
12 rs1000000 0 126890980 A G
4 rs10000003 0 57561647 A G
4 rs10000006 0 108826383 C T
4 rs10000007 0 114553253 C A
4 rs10000008 0 172776204 T C
文件2:
4 rs10000007 C A 0.006562 762
4 rs10000008 T C 0.01575 762
4 rs10000009 G A 0 762
12 rs1000000 A G 0.2388 762
4 rs10000010 C T 0.4921 762
4 rs10000003 A G 0.2992 762
4 rs10000005 G A 0.4409 762
4 rs10000012 G C 0.1417 762
4 rs10000006 C T 0.02625 762
4 rs10000011 T C 0.03675 762
我使用 sort 根据第 2 列对这些文件进行排序,该列包含两个文件的相同值。
sort -f -k 2 file1 > file1.sorted
sort -f -k 2 file2 > file2.sorted
但是,我得到了两个 不同 排序的文件:
file1.sorted:
12 rs1000000 0 126890980 A G
4 rs10000003 0 57561647 A G
4 rs10000005 0 85161558 G A
4 rs10000006 0 108826383 C T
4 rs10000007 0 114553253 C A
4 rs10000008 0 172776204 T C
4 rs10000009 0 71048953 G A
4 rs10000010 0 21618674 C T
2 rs1000001 0 50711642 T G
4 rs10000011 0 138223055 T C
file2.sorted:
4 rs10000003 A G 0.2992 762
4 rs10000005 G A 0.4409 762
4 rs10000006 C T 0.02625 762
4 rs10000007 C A 0.006562 762
4 rs10000008 T C 0.01575 762
4 rs10000009 G A 0 762
12 rs1000000 A G 0.2388 762
4 rs10000010 C T 0.4921 762
4 rs10000011 T C 0.03675 762
4 rs10000012 G C 0.1417 762
我在这里缺少什么?如何让这两个文件以相同的方式排序?以哪种方式对我来说并不重要,只要我可以使用 join 来加入这两个文件。非常感谢!
【问题讨论】:
-
你可能需要使用
-k 2,2 -
查看这个出色的答案以了解更多详情:unix.stackexchange.com/questions/104525/…