【问题标题】:wget downloads html file, but I need a fasta filewget 下载 html 文件,但我需要一个 fasta 文件
【发布时间】:2019-02-13 14:17:27
【问题描述】:

我必须在 NCBI 中搜索 ID CAA37914 并在 ubuntu-18.04 上使用 wget 下载 fasta 文件并将文件重命名为 CAA37914.fa。

我查了ID,得到了以下网址:https://www.ncbi.nlm.nih.gov/protein/CAA37914.1/?report=fasta

我尝试了以下方法:

wget https://www.ncbi.nlm.nih.gov/protein/CAA37914.1/?report=fasta -O CAA37914.fa

但这没有用。我做错了什么?

我得到一个带有 html 输出的文件

编辑:

我想我必须这样做:

wget “link/entrez/eutils/efetch.fcgi?db=nucleotide&id=NM_208885&retype=fasta” -O NP_983532_dna.fa 

【问题讨论】:

  • 该 URL 转到 HTML 页面。你期待什么?
  • 您似乎想下载查看fasta格式数据时生成的实际内容?仅使用 wget 是不可能的。但是,您可以将实际页面下载为 html,然后使用其他工具解析 viewercontent1 pre 标记的实际内容。
  • ncbi.nlm.nih.gov/sviewer/… 看起来像是生成纯文本(选项“发送到”-“文件”)。

标签: wget ncbi


【解决方案1】:

我想通了。 这就是答案:

wget "http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&id=CAA37914&rettype=fasta" -O CAA37914.fa

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-01-30
    • 1970-01-01
    • 1970-01-01
    • 2017-05-21
    • 1970-01-01
    • 2013-03-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多