【问题标题】:Gene Protein Sequence Database [closed]基因蛋白质序列数据库[关闭]
【发布时间】:2021-02-16 10:10:34
【问题描述】:

我想知道是否有办法从 NCBI 下载或检索所有基因的蛋白质序列。我有很多 GeneID,我想迭代并检索它们的蛋白质序列。

是否有我用于此的软件包或链接到来自 NCBI 的基因的蛋白质序列?

【问题讨论】:

    标签: python bioinformatics biopython ncbi


    【解决方案1】:

    如果我理解正确,您可以直接从 NCBI 网站下载数据。搜索“基因的蛋白质序列”会返回 45260 条记录,可以通过单击send to(右上角)下载并保存为文件。 检查here。下载后,您可以简单地从文件中加载数据。

    如果您询问以编程方式下载数据,您可以使用this FTP,下载最新数据,解压并找到您要查找的内容,按 GeneID 过滤。这些文件中的大多数每天都会更新。您可以阅读更多here 并根据此选择包含您需要的数据的文件。就我而言,您需要 gene2accession.gzgene2refseq.gz

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-05-13
      • 2012-06-27
      • 2013-01-16
      • 1970-01-01
      • 2018-02-03
      相关资源
      最近更新 更多