【发布时间】:2014-12-15 05:10:30
【问题描述】:
我正在研究网络爬虫,我发现一些网站使用 JSON 填充其内容。这让我很难使用 SIMPLE HTML DOM 获取数据。有什么方法可以获取我可以在检查元素中看到的最终 HTML 代码?
【问题讨论】:
-
是的,您只需 json_decode 字符串,现在您就有了原始数据。
标签: javascript php json web-crawler simple-html-dom
我正在研究网络爬虫,我发现一些网站使用 JSON 填充其内容。这让我很难使用 SIMPLE HTML DOM 获取数据。有什么方法可以获取我可以在检查元素中看到的最终 HTML 代码?
【问题讨论】:
标签: javascript php json web-crawler simple-html-dom
这不是一项简单的任务。您需要使用“无头浏览器”并在页面上实际执行 JavaScript。有几种无头浏览器实现可供选择(只需搜索该术语);那么,当然,您必须从 PHP 驱动它们。
【讨论】: