【发布时间】:2020-03-05 10:22:31
【问题描述】:
我有 314 个文件的数据(名称如 file1 fil2 file3 ......)。每个文件有两列和不同的行。
示例输入文件 1
a 19
b 9
c 8
i 7
g 6
d 5
示例输入文件2
a 19
i 7
g 6
d 5
我有另一个文件 (data.txt) 有 314 行,每行有不同的列数
a d c g
a i
a d
d c
我想将 file1 的第 1 列与 data.txt 文件的第 1 行进行比较,并将 file2 的第 1 列与 data.txt 的第 2 行进行比较。依此类推,直到 file314 的第 1 列和 data.txt 文件的第 314 行。
我的预期输出是特定文件和特定行匹配和不匹配的基因数量。
我只能使用单独的文件来做到这一点。如何做到这一点我单一的命令。
预期输出
Matched Mismatched
Ist_file_1st row 4 2
2nd_file_2nd row 2 2
.
.
314_file_314th row - -
【问题讨论】:
-
你的意思是每一行的所有列都应该与每一行的列匹配?还是应该只匹配第一列?
-
只有第一列。
-
1 更多澄清应该
Ist_column_1st row是Ist_file_1st row?我在吗? -
是的。我纠正了这一点。