【问题标题】:Getting the most recent version of a file kept by archive.org获取 archive.org 保存的文件的最新版本
【发布时间】:2013-04-05 18:37:11
【问题描述】:

我有一组收获的原子提要。他们中的一些人已经有几年了,一些帖子链接到不再存在的图像。

有什么方法可以获取Way Back Machine 保存的最新版本?

我知道我可以手动完成,但我想自动化这个过程。 archive.org 提供了一个宁静的 API,但据我所知,它似乎没有提供我需要的特定调用。我想我总是可以回退到网络抓取,但我更喜欢更优雅的解决方案,如果有的话。

【问题讨论】:

    标签: api rest web web-scraping archive


    【解决方案1】:

    想通了。要获取文件的最新版本,您只需 GET URL(不要忘记检查 HTTP 状态代码是否为 200):

    http://web.archive.org/web/form-submit.jsp?type=replay&url=<file_url>

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-02-26
      • 1970-01-01
      • 2011-11-04
      • 2022-10-15
      • 1970-01-01
      • 2016-09-08
      • 1970-01-01
      • 2014-06-09
      相关资源
      最近更新 更多