【发布时间】:2015-05-20 23:14:13
【问题描述】:
我想抓取几个网站,这些网站显然是使用 JavaScript 渲染的。具体来说,我想定位这个网站:http://cve.mitre.org/find/index.html
这是我的代码:
$client = new Client();
$crawler = $client->request('GET', 'http://cve.mitre.org/find/index.html');
$form = $crawler->selectButton('Search')->form();
$crawler = $client->submit($form, array('search' => 'Symphony'));
print $crawler->html();
如果我查看源代码,我看不到 HTML,因为这个请求是由 JavaScript 完成的,那么,有人知道如何抓取这类网站吗?
【问题讨论】:
标签: php html web-crawler goutte