【发布时间】:2017-04-28 16:25:44
【问题描述】:
我正在尝试使用 DOMXPath 获取搜索结果的项目。下面是一个包含 4 个结果元素的搜索结果示例:
https://www.11880.com/suche/0521441422/deutschland
现在使用以下代码,我得到了 4 个元素的那些,但我不知道如何获取元素中的每个项目(如名称、街道等)。
你能帮我解决这个问题吗?
$ch = curl_init();
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.1) Gecko/20061204 Firefox/2.0.0.1');
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, 'https://www.11880.com/suche/0521441422/deutschland');
$page = curl_exec($ch);
$dom = new DOMDocument();
$dom->loadHTML($page);
$xpath = new DOMXPath($dom);
foreach($xpath->query('//li[@class="search-result-list-item"]') as $item)
{
echo trim($item->nodeValue).'<br>';
}
【问题讨论】:
-
如果您设法解决了问题,请告诉我,GL
标签: php xpath web-scraping scrape