【发布时间】:2018-06-07 08:59:10
【问题描述】:
我们有几个旧网站正在进行升级。如果能够截取每个页面,然后 md5 将两个域的结果相加,然后测试呈现的所有内容是否 100% 匹配,这将很有用。
我不确定如何执行此操作 - 我们查看了 cheerio 可以抓取该网站但无法截图,以及可以截图但不能抓取该网站的 nightwatch。有人有这方面的经验吗?
【问题讨论】:
-
@Patrick Roberts - 你在截取维基百科时真的经历过这种情况吗?
标签: javascript phantomjs web-crawler nightwatch.js cheerio