比较两个文本文件中的列并匹配行答案

【问题标题】：Compare columns in two text files and match lines比较两个文本文件中的列并匹配行
【发布时间】：2016-03-29 04:12:33
【问题描述】：

我想比较 file1 中的第二列（由空格分隔）：

n01443537/n01443537_481.JPEG n01443537
n01629819/n01629819_420.JPEG n01629819
n02883205/n02883205_461.JPEG n02883205

file2 中的第二列（由空格分隔）：

val_8447.JPEG n09256479
val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205
val_8480.JPEG n03089624

如果匹配，我想打印出file2的对应行。

本例中所需的输出：

val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205

我尝试了以下，但输出文件为空：

awk -F' ' 'NR==FNR{c[$2]++;next};c[$2] > 0' file1.txt file2.txt > file3.txt

也试过这个，但结果是一样的（空输出文件）：

awk 'NR==FNR{a[$2];next}$2 in a' file1 file2 > file3.txt

【问题讨论】：

【解决方案1】：

GNU join 就是为此目的而存在的。

join -o "2.1 2.2" -j 2 <(sort -k 2 file1) <(sort -k 2 file2)

【讨论】：

【解决方案2】：

使用 awk：

awk 'FNR==NR{a[$NF]; next} $NF in a' file1 file2

val_68.JPEG n01443537
val_1054.JPEG n01629819
val_1542.JPEG n02883205

这是一个带有进程替换的grep 替代方案：

grep -f <(awk '{print " " $NF "$"}' file1) file2

使用print " " $NF "$" 创建像" n01443537$" 这样的正则表达式，以便我们只匹配grep 中的最后一列。

【讨论】：