【发布时间】:2020-10-24 06:45:49
【问题描述】:
我目前正在编写一个程序,该程序需要我从 NCBI 中抓取文章。
我正在使用 Entrez 实用程序来执行此操作 (https://www.ncbi.nlm.nih.gov/books/NBK25497/)。
我已经想出了如何使用 PubMed 数据执行此操作,即使用 handle = Entrez.efetch(db='pubmed', id=pmid, retmode='text', rettype='abstract')。
但是,我想从 NCBI 的书籍部分抓取数据,因为 pubmed 部分包含不完整的文章(例如比较 https://pubmed.ncbi.nlm.nih.gov/20301533/ 与 https://www.ncbi.nlm.nih.gov/books/NBK1359/)。
我有一个文本文件中所有 GeneReviews ID(例如 NB1359、NB1400 等)的列表,但我不确定如何抓取这些数据,因为handle = Entrez.esearch(db='books', term="NB1359", retmode='text') 不会返回文章中的文本。
【问题讨论】:
标签: python text-mining biopython ncbi