【发布时间】:2013-08-17 09:21:08
【问题描述】:
我有这个简单的代码来获取任何页面的标题
<?php
$doc = new DOMDocument();
@$doc->loadHTMLFile('http://www.facebook.com');
$xpath = new DOMXPath($doc);
echo $xpath->query('//title')->item(0)->nodeValue."\n";
?>
它在我尝试过的所有页面上都运行良好,但在 Facebook 中却没有。
当我在 Facebook 中尝试时,它没有显示 Welcome to Facebook - Log In, Sign Up or Learn More,但它显示了 Update Your Browser | Facebook。
我认为用户代理有问题。那么有没有办法改变用户代理或者有没有其他解决方案呢?
【问题讨论】:
-
我会使用 curl 加载 html 并传递给 DOMDocument
-
我该怎么做。有示例代码吗?
-
在下面查看我的答案
-
不是同一个问题,但回答了你的问题:stackoverflow.com/questions/5975213/…
-
@Gordon 我怎样才能只得到标题?
标签: php url dom domdocument domxpath