【发布时间】:2014-10-22 07:43:06
【问题描述】:
我编写了一个小型 biopython 脚本来根据 ID 从 fasta 文件中提取序列,但它确实提取了重复项,因此我希望从我的 fasta 文件中过滤重复的序列(例如,具有完全相同的 ID)。
我试图修改我的脚本,但失败了:
from Bio import SeqIO
id = []
for line in open("short.txt","r"):
id.append(line.rstrip().strip('"'))
for rec in SeqIO.parse("out.fa","fasta"):
#print rec.id
if rec.id in id:
if rec.id not in rec.format:
print rec.format("fasta")
谁能帮忙?
【问题讨论】: