【发布时间】:2019-02-13 14:17:27
【问题描述】:
我必须在 NCBI 中搜索 ID CAA37914 并在 ubuntu-18.04 上使用 wget 下载 fasta 文件并将文件重命名为 CAA37914.fa。
我查了ID,得到了以下网址:https://www.ncbi.nlm.nih.gov/protein/CAA37914.1/?report=fasta
我尝试了以下方法:
wget https://www.ncbi.nlm.nih.gov/protein/CAA37914.1/?report=fasta -O CAA37914.fa
但这没有用。我做错了什么?
我得到一个带有 html 输出的文件
编辑:
我想我必须这样做:
wget “link/entrez/eutils/efetch.fcgi?db=nucleotide&id=NM_208885&retype=fasta” -O NP_983532_dna.fa
【问题讨论】:
-
该 URL 转到 HTML 页面。你期待什么?
-
您似乎想下载查看fasta格式数据时生成的实际内容?仅使用 wget 是不可能的。但是,您可以将实际页面下载为 html,然后使用其他工具解析
viewercontent1 pre标记的实际内容。 -
ncbi.nlm.nih.gov/sviewer/… 看起来像是生成纯文本(选项“发送到”-“文件”)。