【问题标题】:Is there a way to recover an entire website from the wayback machine?有没有办法从 Wayback 机器中恢复整个网站?
【发布时间】:2017-03-21 20:12:17
【问题描述】:

我的网站文件已损坏并以某种方式丢失了所有备份文件。任何人都可以建议下载整个网站的过程。

它是一个简单的 html 网站。下载后如何托管? 请帮忙

【问题讨论】:

    标签: download web hosting webarchive


    【解决方案1】:

    您不能使用常规爬虫,因为所提供的内容具有原始链接,因此如果您不重写链接,那么您在爬取时会立即跳出第一页:在浏览器中它们会被重写使用客户端脚本指向 Wayback Machine。

    如果它像您提到的那样是简单的 html,并且非常小,您可能需要手动保存页面,甚至手动将内容复制到新的网站结构中。如果它不小,请尝试超级用户中类似问题的答案中提到的工具:https://superuser.com/questions/828907/how-to-download-a-website-from-the-archive-org-wayback-machine

    下载后,您可能需要检查下载文件的结构,以查找可能被错误重写的链接或丢失的文件。指向属于该网站的文件的链接应该是本地链接,而不是外部链接。然后,您可以在您喜欢的网络托管服务上再次托管它。

    【讨论】:

      猜你喜欢
      • 2023-04-03
      • 1970-01-01
      • 1970-01-01
      • 2016-05-21
      • 1970-01-01
      • 2021-07-19
      • 1970-01-01
      • 2016-05-11
      • 2011-10-31
      相关资源
      最近更新 更多