【问题标题】:blast against genomes in biopython在 biopython 中对基因组进行爆炸
【发布时间】:2014-07-11 09:54:26
【问题描述】:
from Bio.Blast import NCBIXML
from Bio.Blast import NCBIWWW

result_handle = NCBIWWW.qblast(
    "blastn",
    "nr",
    "CACTTATTTAGTTAGCTTGCAACCCTGGATTTTTGTTTACTGGAGAGGCC",
    entrez_query='"Beutenbergia cavernae DSM 12333" [Organism]')

blast_records = NCBIXML.parse(result_handle)

for blast_record in blast_records:
    for alignment in blast_record.alignments:
        for hsp in alignment.hsps:
            print(hsp.query[0:75] + '...')
            print(hsp.match[0:75] + '...')
            print(hsp.sbjct[0:75] + '...')

这并没有给我一个输出,虽然序列实际上是基因组的序列, 所以我必须得到一个结果。 错误在哪里? 查询是否正确?

【问题讨论】:

    标签: biopython blast genome


    【解决方案1】:

    您的查询未返回任何结果。爆炸的默认参数是原因。这些参数在这种特殊情况下的小长度查询效果更好:

    result_handle = NCBIWWW.qblast(
        "blastn",
        "nr",
        "CACTTATTTAGTTAGCTTGCAACCCTGGATTTTTGTTTACTGGAGAGGCC",
        megablast=False,
        expect=1000,
        word_size=7,
        nucl_reward=1,
        nucl_penalty=-3,
        gapcosts="5 2",
        entrez_query='Beutenbergia cavernae DSM 12333 [Organism]')
    

    尤其是expect 参数在这里起着重要作用。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-03-07
      • 1970-01-01
      • 2022-01-16
      • 2017-02-18
      • 2019-07-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多