【发布时间】:2018-06-05 18:04:42
【问题描述】:
我尝试通过 Goutte 列表从流行的拍卖网络服务中抓取,但其中的部分代码是由 javascript 呈现的,问题是 Goutte 只返回我没有 JS 作业的 DOM。因此,如果交响乐是无头浏览器,是否可以等待抓取直到呈现完整内容?我检查了phantomjs哪里正常,但是我从来没有在Goute中找到那个能力..
【问题讨论】:
我尝试通过 Goutte 列表从流行的拍卖网络服务中抓取,但其中的部分代码是由 javascript 呈现的,问题是 Goutte 只返回我没有 JS 作业的 DOM。因此,如果交响乐是无头浏览器,是否可以等待抓取直到呈现完整内容?我检查了phantomjs哪里正常,但是我从来没有在Goute中找到那个能力..
【问题讨论】:
【讨论】:
https://github.com/FriendsOfPHP/Goutte
Goutte 不解析 Javascript,它不是无头浏览器,它只是下载内容并解析它而不运行 javascript。
技术信息
Goutte 是对以下优秀 PHP 库的精简包装:
Symfony 组件:BrowserKit、CssSelector 和 DomCrawler; Guzzle HTTP 组件。
【讨论】: