【发布时间】:2017-05-07 19:33:55
【问题描述】:
我有五个文件,其中包含一些重复的字符串。
文件 1:
a
文件2:
b
文件3:
a
b
文件4:
b
文件5:
c
所以我用awk 'NR==FNR{A[$0];next}$0 in A' file1 file2 file3 file4 file5
它会打印$ a,但正如您所见,b 字符串在其他文件中重复了 3 次,但仅打印 a。
那么如何使用一行命令通过分析/比较每个文件来获取所有重复的字符串(ab)?另外我如何获得每个元素的重复次数。
【问题讨论】:
-
如果重复出现在 1 个文件中而不是出现在多个文件中,您是否希望以不同的方式处理重复?如果是这样,您想要什么不同的行为?
-
@EdMorton 但是我从下面的答案中得到了解决方案。我只是想要,因为我希望通过相互比较来查看每个文件的重复值。
标签: linux bash awk terminal text-processing