【发布时间】:2014-03-30 17:41:36
【问题描述】:
我正在寻找可能的脚本算法,它将搜索我在 str 对象中定义的长 DNA 序列以查找指定的基序(较短的 DNA 片段),计算每个发现(假设我的 seq 有几个相同的基序),然后打印已检测到基序的序列中的第一个核苷酸编号。
假设在每个对象下方定义,我应该在某个循环中使用此类搜索,因为下面的两个示例都只能找到 1 次主题。指定这种循环的正确方法是什么?
#Loading data
seq = open('motif.txt', 'r')
chains=[]
[chains.append(line[:-1]) for line in seq]
Seq,Motif = chains[0], chains[1]
count=0
# Search motif
Seq.find(Motif)
if y == 1:
print "%s has been detected" %(Motif)
if Motif in Seq:
print "%s has been detected" %(Motif)
【问题讨论】:
标签: python sequence bioinformatics