【发布时间】:2012-09-18 11:39:40
【问题描述】:
我们正在关闭The Conversations Network(包括IT Conversations 播客)。计划是在Internet Archive 上呈现我们网站的静态 HTML 版本,以便永久托管。
从目前由 PHP 动态生成的大约 5,000 个动态页面生成静态 HTML 的最简单方法是什么?
我知道我们可以调整代码以缓存 PHP 输出,将其写入文件,然后遍历站点地图以生成每个页面。但我想知道是否有任何我们应该考虑的选择。有什么工具可以做到这一点并按原样抓取 HTML? (不是 Acrobat Pro?)
不幸的是,我们还有相当多的 Ajax 调用,这将使这变得更加困难。我想我们必须先取消 Ajax。
【问题讨论】:
-
也许Internet Archive 的人会有好主意。
-
如果 Ajax 调用是 POST 调用,那你就完蛋了。设计网站是有好处的,这样它们就可以静态工作,尤其是存档。例如。如果您有一个包含有价值内容的网站。但这是一个设计决定,如果您以后需要,还有一些工作要做。
标签: php caching web-scraping render static-html