【发布时间】:2018-11-01 00:37:12
【问题描述】:
我有 2 个制表符分隔的文件,如下所示:
file1.txt
chr1 710000 715000 143
chr1 715000 720000 144
chr1 720000 725000 145
chr1 725000 730000 146
chr1 730000 735000 147
chr1 735000 740000 148
chr1 740000 745000 149
chr1 745000 750000 150
chr1 750000 755000 151
chr1 755000 760000 152
chr1 760000 765000 153
file2.txt
143 143 84
143 144 26
143 152 32
143 153 15
144 152 11
预期输出:
output.txt
chr1 710000 715000 chr1 710000 715000 84
chr1 710000 715000 chr1 715000 720000 26
chr1 710000 715000 chr1 755000 760000 32
chr1 710000 715000 chr1 760000 765000 15
chr1 715000 720000 chr1 755000 760000 11
我想将 file1.txt(第 4 列)中的唯一数字与 file2.txt(第 1 和 2 列)中的数字进行匹配,并将它们替换为file1.txt(第 1-3 列)中的值。 output.txt 应该有 7 列,其中最后一列具有 file2.txt(第 3 列)中的相应值。
【问题讨论】:
-
文件是否已排序/可排序?让它们匹配顺序可能会简化所需的逻辑。另外,文件有多大?