【发布时间】:2015-07-10 20:35:30
【问题描述】:
我有 30 个文件,其中每个文件的第 1 列相似。我想加入基于第 1 列的文件,以便输出文件包含来自每个输入文件的第 2 列。我知道如何加入两个文件,但处理多个文件时遇到了困难。
join -1 1 -2 1 File1 File2
文件以制表符分隔,没有这样的标题
文件1
5S_rRNA 1324
5_8S_rRNA 32
7SK 15
ACA59 0
ACA64 0
BC040587 0
CDKN2B-AS 0
CDKN2B-AS_2 0
CDKN2B-AS_3 0
CLRN1-AS1 0
文件2
5S_rRNA 571
5_8S_rRNA 11
7SK 5
ACA59 0
ACA64 0
BC040587 0
CDKN2B-AS 0
CDKN2B-AS_2 0
CDKN2B-AS_3 0
CLRN1-AS1 0
输出
5S_rRNA 1324 571
5_8S_rRNA 32 11
7SK 15 5
ACA59 0 0
ACA64 0 0
BC040587 0 0
CDKN2B-AS 0 0
CDKN2B-AS_2 0 0
CDKN2B-AS_3 0 0
CLRN1-AS1 0 0
【问题讨论】:
-
更好地发布您的代码并提供预期的输出。
-
值的顺序重要吗?
-
我有一个解决方案 - 但它确实需要一个标题行。您可能需要“伪造一个”才能使其正常工作。它查找常见的(命名的)标题,并基于它合并一个或多个 CSV 文件。 stackoverflow.com/a/31245514/2566198