【问题标题】:script to open and download each page of a web-site?打开和下载网站每个页面的脚本?
【发布时间】:2011-08-06 07:38:52
【问题描述】:

有一个非常强大的 CLI 工具 - wget。但它似乎对下载 wiki 很不利——它下载整个数据库——而不是仅仅下载所有文章的当前版本......也许有一个脚本(python 或 perl)来加载给定网站的每个页面浏览器 - 并下载它。

【问题讨论】:

  • 所以我下载了一个带有默认 webhttrack 选项的 wiki。似乎它没有按照我的意愿下载所有修订版。

标签: web download wiki wget


【解决方案1】:

使用HTTrack

它可以通过命令行调用,也可以通过 GUI 调用。这是一款功能丰富的产品。他们有command-lineGUI 用法的用户指南。

【讨论】:

  • 感谢我现在正在学习 HTTrack - 将尝试下载一个带有它的 wiki。无论如何,我会将这个问题留待一段时间 - 以便收集各种解决方案。
  • 没问题。我已经使用 HTTrack 多年,并产生了所需的结果。重要的是我们可以自定义它以获得我们所需要的。
猜你喜欢
  • 2014-09-16
  • 1970-01-01
  • 1970-01-01
  • 2023-03-27
  • 1970-01-01
  • 2023-03-03
  • 1970-01-01
  • 2011-04-15
  • 1970-01-01
相关资源
最近更新 更多