【发布时间】:2015-05-02 10:07:05
【问题描述】:
我正在了解 HTML DOM 解析器及其工作原理。我有一个障碍,我无法解析以下链接,但我能够解析根域和其他网站。有人可以帮我理解为什么我无法解析这个特定的链接吗?
<?php
include('simple_html_dom.php');
$base = 'http://www.stupidstudios.com/samsung-galaxy-s6/p/bbuynow';
$curl = curl_init();
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($curl, CURLOPT_HEADER, false);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl, CURLOPT_URL, $base);
curl_setopt($curl, CURLOPT_REFERER, $base);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE);
$str = curl_exec($curl);
curl_close($curl);
$html_base = new simple_html_dom();
$html_base->load($str);
foreach($html_base->find('h1') as $element) {
echo "<pre>";
print_r( $element );
echo "</pre>";
}
$html_base->clear();
unset($html_base);
?>
【问题讨论】:
-
会报错吗?
-
没有。我认为链接没有被解析。如果我尝试来自不同网站的不同链接,它会起作用。我只是好奇是什么让这个链接与众不同。
-
如果你尝试 echo $str,你会得到有趣的结果,也许它会有所帮助,不确定...
-
确实如此。它正在引发 HTTP 错误! HTTP ERROR: 500
Problem accessing /p. Reason: Server Error Powered by Jetty://但是我不知道那是什么?
标签: php html curl simple-html-dom