【发布时间】:2020-05-26 11:29:47
【问题描述】:
我有几个看起来像这样的文件。
RF02883_full.txt
# STOCKHOLM 1.0
#=GF ID BcKCsr2
#=GF DE Burkholderia sRNA 2
AM747720.1/2136330-2136461 AUGAAUGCCAGUUCGCCCCAUAUUUCUCGUAGCUGCGC------CGGUGC--------CCGUUG---------------CAAUGCUUCCC----------GGCACCUGACGC---GCAUCACGACG--GCAU-CAGCCGAGCCGCAUGUCCCUGUCGACGGGGCAGCGGCUUUUUUU
BX571965.1/1703315-1703186 AUGAAUGCCUGUCCGACCCAUUUUUCUCGUAGCUGCGC------CGGUGG--------UCCAAA---------------CGAUGCGCCCA----------CGCGCCUGACGCGCAGCACG---ACG--GUUA-AAGCCGAGCCGCUCGCCCCUGUU--CGGGGGAGCGGCUUUUUUU
NF0023_full.txt
# STOCKHOLM 1.0
#=GF ID B
#=GF DE B 2
BX57195.1/1703315-1703186 AUGAAUGCCUGUCCGACCCAUUUUUCUCGUAGCUGCGC------CGGUGG--------UCCAAA---------------CGAUGCGCCCA----------CGCGCCUGACGCGCAGCACG---ACG--GUUA-AAGCCGAGCCGCUCGCCCCUGUU--CGGGGGAGCGGCUUUUUUU
我想提取第一个标识符并将其存储在文件名的新文件中: 所以示例输出
RF02883 AM747720.1/2136330-2136461
NF0023 BX57195.1/1703315-1703186
到目前为止我尝试过的代码:
awk '
/!#=/{
close(file)
file=count=""
}
(/!#=/ || !NF) && !file{
}input.txt
【问题讨论】:
-
抱歉,这不是 StackOverflow 的工作方式。 “我想做 X,请给我提示和/或示例代码”形式的问题被认为是题外话。请访问help center 并阅读How to Ask,尤其是阅读Why is “Can someone help me?” not an actual question?。您提到您尝试了一些代码,但您提到的代码无法尝试,因为它甚至没有编译。