【发布时间】:2021-01-15 21:58:29
【问题描述】:
我有一个超过 40.000 行的文件(file1),我想提取与 file2 中的模式匹配的行(大约 6000 行)。我这样用grep,但是很慢:
grep -f file2 file1 > out
使用awk 或sed 是否有更快的方法来执行此操作?
以下是我文件中的一些摘录:
File1:
scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG
scitn007747.1| scign007747 CACGCAGACGCAGTGGAGCATTCCAGGTCACAA
scitn003155.1| scign003155 TAAAAATCGTTAGCACTCGCTTGGTACACTAAC
scitn018252.1| scign018252 CGTGTGTGTGCATATGTGTGCATGCGTG
scitn004671.2| scign004671 TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT
File2:
scign000003
scign000004
scign000005
scign004671
scign000013
【问题讨论】: