【发布时间】:2014-04-15 10:12:31
【问题描述】:
我知道我可以使用file_get_contents 之类的东西在本地保存网页的源代码,并且我知道如何操作它的文本。但是,如果网页具有动态生成内容的 JavaScript 怎么办?如何下载完整呈现的页面源代码?
【问题讨论】:
-
PhantomJS 是一个不错的选择,并且易于集成。
我知道我可以使用file_get_contents 之类的东西在本地保存网页的源代码,并且我知道如何操作它的文本。但是,如果网页具有动态生成内容的 JavaScript 怎么办?如何下载完整呈现的页面源代码?
【问题讨论】:
您需要通过渲染引擎传递数据。最简单的选择是以编程方式控制 Web 浏览器。可以帮助您做到这一点的库包括 Selenium 和 php-phantomjs。
【讨论】: