【发布时间】:2010-10-07 00:50:19
【问题描述】:
我们实际上已经多次为客户烧录我们的 asp.net 网站的静态/存档副本。到目前为止,我们一直在使用WebZip,但我们遇到了无穷无尽的问题,比如崩溃、下载的页面没有正确重新链接等等。
我们基本上需要一个应用程序来抓取和下载我们的 asp.net 网站上所有内容(页面、图像、文档、css 等)的静态副本,然后处理下载的页面,以便可以在没有互联网连接的情况下在本地浏览它们(摆脱链接中的绝对网址等)。白痴证明越多越好。这似乎是一个非常常见且(相对)简单的过程,但我已经尝试了一些其他应用程序并且真的不为所动
有没有人推荐的存档软件?有没有人愿意分享一个非常简单的过程?
【问题讨论】:
-
查看archivebox.io,它是一个开源、自托管的工具,可创建本地、静态、可浏览的网站 HTML 克隆(它保存 HTML、JS、媒体文件、PDF、屏幕截图、静态资产等等)。
标签: html web-crawler archive