【发布时间】:2022-01-11 13:11:31
【问题描述】:
我正在尝试抓取一个 covid-19 统计网站,该网站有一堆链接到有关不同国家统计数据的页面。这些链接都有一个类名,可以使用 css 选择器 ('mt_a') 轻松访问它们。国家之间没有连续性,因此如果您在其中一个国家/地区的网页上,则没有前往下一个国家/地区的链接。我是一个完全的scrapy初学者,如果我的目标是抓取根页面上列出的所有(200 ish)链接以获得相同的几条信息,我不确定我应该怎么做。任何关于我应该尝试做什么的指导将不胜感激。
我要抓取的链接:https://www.worldometers.info/coronavirus/ (向下滚动查看国家/地区链接)
【问题讨论】:
-
如果您发现有帮助的解决方案,请接受。
标签: python html web-scraping scrapy web-crawler