【发布时间】:2017-03-21 20:12:17
【问题描述】:
我的网站文件已损坏并以某种方式丢失了所有备份文件。任何人都可以建议下载整个网站的过程。
它是一个简单的 html 网站。下载后如何托管? 请帮忙
【问题讨论】:
标签: download web hosting webarchive
我的网站文件已损坏并以某种方式丢失了所有备份文件。任何人都可以建议下载整个网站的过程。
它是一个简单的 html 网站。下载后如何托管? 请帮忙
【问题讨论】:
标签: download web hosting webarchive
您不能使用常规爬虫,因为所提供的内容具有原始链接,因此如果您不重写链接,那么您在爬取时会立即跳出第一页:在浏览器中它们会被重写使用客户端脚本指向 Wayback Machine。
如果它像您提到的那样是简单的 html,并且非常小,您可能需要手动保存页面,甚至手动将内容复制到新的网站结构中。如果它不小,请尝试超级用户中类似问题的答案中提到的工具:https://superuser.com/questions/828907/how-to-download-a-website-from-the-archive-org-wayback-machine
下载后,您可能需要检查下载文件的结构,以查找可能被错误重写的链接或丢失的文件。指向属于该网站的文件的链接应该是本地链接,而不是外部链接。然后,您可以在您喜欢的网络托管服务上再次托管它。
【讨论】: