【发布时间】:2020-02-07 10:21:43
【问题描述】:
我正在尝试一个需要我爬过维基百科列表的宠物项目:按月显示每日页面的图片。例如:https://en.wikipedia.org/wiki/Wikipedia:Picture_of_the_day/May_2004 有一个图像列表,后跟每个图像的简短标题。我想在这里做以下两件事:
- 从页面和相应的标题中抓取所有图像。 (最好是一个字典来存储 Image: Caption 对)
- 遍历其他月份并重复 1。
任何有关如何实现此目的的帮助将不胜感激。
非常感谢。
【问题讨论】:
-
到目前为止你尝试过什么? SO 不是代码编写服务,请向我们展示一些我们可以提供帮助的东西。
标签: python web-crawler screen-scraping wikipedia