【发布时间】:2018-07-22 05:36:26
【问题描述】:
我有一个包含多篇文章和阅读更多按钮的页面。 我想单击每个阅读更多按钮并从该页面获取帖子文本,但我不知道该怎么做。 这是我的php代码。谢谢大家
$client = new Client();
$guzzleClient = new GuzzleClient(array(
'timeout' => 60,
));
$client->setClient($guzzleClient);
$crawler = $client->request('GET', 'http://example.com/');
$crawler->filter('article > div > p > span > a')->each(function ($node) use ($client,$crawler)
{
$crawler = $client->click($crawler->selectLink('read more')->link());
echo $crawler->html();
$crawler = $client->request('GET', 'http://example.com/');
});
【问题讨论】:
-
你现在遇到了什么问题?
-
@AmitMerchant 我真的不知道该怎么做
-
echo $crawler->html();说什么? -
@stef 我只是想测试一下...你知道我该怎么做吗?
标签: php symfony web-scraping goutte