【发布时间】:2013-07-01 01:51:56
【问题描述】:
我想从输入 fasta 文件中检索第 nth 序列(或者最好是从 nth 到 mth 序列),理想情况下使用 unix“单线”。
我知道我可以用 perl(或任何其他脚本语言)读取序列,计数,然后打印序列,但我正在寻找更快、更紧凑的东西。
对于那些不知道的人,示例 fasta 文件如下所示:
>SEQUENCE_1
MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG
LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK
IPQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTL
MGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQL
>SEQUENCE_2
SATVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQI
ATIGENLVVRRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH
【问题讨论】:
-
您能否更新问题以准确反映您正在寻找的内容?像这样的东西是我想要的输出,这是我尝试过的。
-
@Endoro 抱歉,如果不清楚。如果我在 fasta 文件中有 10 个序列并且想要检索第 5 个序列,那么 n 将是 5。我需要标题(以 > 开头)和它下面的行,直到下一个 >,它标记下一个序列。这有帮助吗?