【发布时间】:2013-04-05 18:37:11
【问题描述】:
我有一组收获的原子提要。他们中的一些人已经有几年了,一些帖子链接到不再存在的图像。
有什么方法可以获取Way Back Machine 保存的最新版本?
我知道我可以手动完成,但我想自动化这个过程。 archive.org 提供了一个宁静的 API,但据我所知,它似乎没有提供我需要的特定调用。我想我总是可以回退到网络抓取,但我更喜欢更优雅的解决方案,如果有的话。
【问题讨论】:
标签: api rest web web-scraping archive