【发布时间】:2019-04-09 10:30:52
【问题描述】:
我在 file_get_contents 和 DOMdocument 以及 Xpath 方面遇到了一些麻烦。
我正在尝试进行一些抓取。 所以我为网站链接做了一个数组。
array(9) {
[0]=>
string(34) "https://lions-mansion.jp/MF081014/"
[1]=>
string(34) "https://lions-mansion.jp/MF161026/"
[2]=>
string(34) "https://lions-mansion.jp/MF171045/"
[3]=>
string(34) "https://lions-mansion.jp/MF161016/"
[4]=>
string(34) "https://lions-mansion.jp/MF171010/"
}
尝试使用 foreach 进入这些链接。并尝试抓取链接rel的href!
foreach ($siteUrls as $sites){
@$html [] = file_get_contents($sites);
}
foreach ($html as $geturl)
{
$grabber = new \DOMXPath($geturl);
$mainLink [] = $grabber->query("//link[@rel='canonical']/@href");
}
var_dump($mainLink);
但最终面临这个错误。
传递给 DOMXPath::__construct() 的参数 1 必须是 DOMDocument,给定字符串
知道如何解决这个问题吗?我怎样才能得到那个link rel url?从头标签
【问题讨论】:
标签: php laravel xpath domdocument