【发布时间】:2015-05-21 19:29:12
【问题描述】:
这对我来说是一种学习体验,但使用的是 Symfony 和 Goutte。我已经能够登录到一个安全的网站,然后返回一个页面。
echo $crawler->html();
我现在要做的是解析对象$crawler。让我感到困惑的是,Goutte 似乎并没有说明如何做到这一点。我想很多人都使用过 Guzzle 和 Goutte,但我不能同时使用 use Guzzle\Client; 和 use Goutte\Client; 声明。
我要做的就是解析$crawler 对象以在html 源代码中找到某些内容。 (注意:这个特定页面没有使用 id 或 classes,所以我不能这样做 filter('#stuff') 或 filter('.stuff')。)
有人可以帮我解释一下如何使用 Goutte 来解析我得到的对象吗?
(编辑:我想指定,我想也许只是搜索一个字符串或其他东西。我可以将$crawler对象转换为纯文本源代码然后只做一个preg_match或其他东西吗?)
【问题讨论】:
标签: symfony web-scraping web-crawler guzzle goutte