【发布时间】:2012-05-08 22:33:57
【问题描述】:
我有这个问题好几天了... 我必须从 php 加载页面的整个 html。 在此页面上,有一个 jquery 函数,当所有页面加载完毕时会调用该函数。此函数将其他 html 加载到页面中,因此我必须加载所有 html(也加载了 jquery 的部分)。我可以知道我让所有页面都试图找到一些仅从 jquery 加载的标签。 (例如:名称为XXX的标签输入、属性多的标签输入等)
所以我试试:
$html = file_get_contents("http://wwww.siteToScrape.com");
if (strpos($html, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
但结果是“未找到”。
然后我下载了simple html dom 并尝试:
include 'simple_html_dom.php';
$html = file_get_html("http://wwww.siteToScrape.com");
if (strpos($html, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
但结果仍然是“未找到”。
所以我想得到一些 php 脚本来模拟浏览器(所以也可以加载 jquery),我下载了 PHP Scriptable Web Browser 并尝试:
require_once('browser.php');
$browser = new SimpleBrowser();
$p = $browser->get('http://wwww.siteToScrape.com');
if (strpos($p, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
但结果仍然是“未找到”。 我不知道该怎么做..有人可以帮助我吗?谢谢!!!!
【问题讨论】:
-
请检查示例中使用的变量是否正确。
-
已更正!这只是这篇文章的复制和粘贴错误:)
标签: php jquery html web-scraping onload