【发布时间】:2017-06-20 01:08:13
【问题描述】:
有人知道有什么工具可以比较两个几乎完全相同的网站吗?
简单地说,我有一个沙盒站点和一个生产站点,并且想找出它们之间的区别,以了解将哪些内容移动到生产站点。
谢谢!
编辑:
好的,我知道我错过了一条重要信息(抱歉!)。这两个站点都是在线的并且基于 CMS (Drupal),因此我需要一些可以在这两个站点上运行的爬虫工具,并显示沙盒中存在哪些页面,而不是生产中的页面。
感谢所有回答的人!
【问题讨论】:
有人知道有什么工具可以比较两个几乎完全相同的网站吗?
简单地说,我有一个沙盒站点和一个生产站点,并且想找出它们之间的区别,以了解将哪些内容移动到生产站点。
谢谢!
编辑:
好的,我知道我错过了一条重要信息(抱歉!)。这两个站点都是在线的并且基于 CMS (Drupal),因此我需要一些可以在这两个站点上运行的爬虫工具,并显示沙盒中存在哪些页面,而不是生产中的页面。
感谢所有回答的人!
【问题讨论】:
使用httrack 下载网站副本,然后使用您最喜欢的文件比较工具查看差异。 (我更喜欢WinMerge,它可以通过两个文件文件夹递归运行,可以选择忽略空格差异和空行,甚至在使用 WINE 的 Linux 下也能很好地运行。)
附:您甚至可能希望通过 HTML Tidy 运行下载的 HTML 文件,以便在进行比较之前对其进行规范化/漂亮格式化。
另一种方法是database comparison。不过,您仍然可以对原始网站文件(不是蜘蛛版本)进行文件比较。从记忆来看,Drupal 数据库的架构并不难理解,尤其是当您主要对节点内容感兴趣时。
【讨论】:
Beyond Compare ... 真是太棒了
【讨论】:
WinMerge 是一个免费/开源工具,可让您比较文件和目录。
您可以显示相同、不同或仅存在于一个目录中的文件。 然后,您可以通过将文件从一个目录复制到另一个目录来使两个目录相同。
【讨论】:
正如sunny所说,使用爬虫和差异工具。
对于爬虫,我更喜欢 httrack 而不是 wget。 如今,许多网站都使用从 css 引用的图像。 当我上次检查时,wget 无法加载从 css 引用的文件。 除此之外,它还有一个不错的 GUI。
从 diff 工具开始: 我从 Windows 3.1 开始就使用 FileSync。 当然还有更多花哨的差异工具,但这个工具简洁干净,可以胜任。 在 unix 上,您始终可以执行 diff -r。 如果你的机器上有 Eclipse,它有一个很好的差异查看器,它也可以比较两个目录。
【讨论】:
Meld 如果您运行的是 Linux,则非常适合。它在 Debian/Ubuntu 存储库中可用。
【讨论】:
无与伦比的好。 Syncback (http://www.2brightsparks.com/downloads.html) 有免费版本,您可以使用任何合并工具,如 araxis 或 winmerge
【讨论】:
将您的代码放入Subversion 或其他一些源代码控制中。准备好部署时,“svn update”将仅更新已更改的内容。
'svn diff' 将显示差异。
【讨论】:
DiffMerge 是另一个支持目录差异的免费跨平台工具。
【讨论】:
您还可以使用一些在线比较服务,例如CopyScape 或ChangeDetection
【讨论】: