【问题标题】:Retrieving DNA sequences from a database of protein sequences?从蛋白质序列数据库中检索 DNA 序列?
【发布时间】:2014-12-05 16:51:26
【问题描述】:

我在 FASTA 中有 1000 多个蛋白质序列及其登录号。我想返回全基因组鸟枪法数据库,检索所有编码与我的初始序列列表中的一个相同的蛋白质的 DNA 序列。

我尝试运行一个 tBlastn,每个序列的结果

这可以通过从命令行运行 blast 和批处理脚本来完成吗?

【问题讨论】:

  • 是的,这可以做到。如果您想知道如何,您需要更具体地了解您遇到的问题。

标签: bioinformatics fasta genome protein-database


【解决方案1】:

您应该至少得到一个结果:编码原始蛋白质的结果。如果我跟着你,其他的,如果有的话,将是假基因。

无论如何,一些编程可能会有所帮助,请查看Biopython。 Bioperl 或 Bioruby 应该具有类似的功能。 特别是你可以BLAST using Biopython

【讨论】:

    【解决方案2】:

    您可能会发现此链接很有用:

    https://www.biostars.org/p/5403/

    那里有人问过类似的问题,并且已经发布了一些合理的解决方案。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-02-16
      • 2012-06-27
      • 2013-01-16
      • 1970-01-01
      • 1970-01-01
      • 2013-11-27
      • 1970-01-01
      相关资源
      最近更新 更多