【发布时间】:2014-09-27 13:05:19
【问题描述】:
我正在尝试检索使用 js 和数据库加载的页面。加载大约需要 2 到 3 分钟。我能够获得显示“请等待 2 到 3 分钟以加载页面”的页面。 但加载后无法检索页面。
我已经尝试了以下方法:
1.) 在机械化中使用mirror method。但是响应内容没有被解码。因此该文件是乱码。 (还尝试编写与镜像方法类似的方法,该方法将解码响应内容,但也不起作用。未加载新内容。)
2.) 尝试添加请求标头“if-modified-since”。但是时间还是一样的,没有获取到新的内容。
任何指针或建议都会很有帮助。
TIA :)
【问题讨论】:
-
是的。我知道。我只想检索页面中的 html。 (完全加载后)
-
JavaScript 没有修改 DOM 吗?
-
它正在修改 DOM,并且可以在浏览器中看到更改,但是在通过 Mechanize 检索页面时,会加载显示“请等待 1 到 2 分钟”的页面。
-
WWW::Mechanize不是浏览器。 Mech 不会看到由加载到 Web 浏览器中的 JavaScript 代码所做的任何 DOM 更改。如果页面通过对服务器进行 AJAX 调用,然后动态创建 DOM 元素来显示结果,您将无法使用 Mech 看到它们。
标签: html perl response mechanize if-modified-since