【发布时间】:2016-07-24 21:38:58
【问题描述】:
所以我正在尝试制作一个 PHP 爬虫(供个人使用)。 代码的作用是为每个发现不到 1 小时但似乎有问题的 ebay 拍卖项目显示“找到”。爬虫无法获取所有 span 元素,“剩余时间”元素为 .
simple_html_dom.php 已下载且未编辑。
<?php include_once('simple_html_dom.php');
//url which i want to crawl -contains GET DATA-
$url = 'http://www.ebay.de/sch/Apple-Notebooks/111422/i.html?LH_Auction=1&Produktfamilie=MacBook%7CMacBook%2520Air%7CMacBook%2520Pro%7C%21&LH_ItemCondition=1000%7C1500%7C2500%7C3000&_dcat=111422&rt=nc&_mPrRngCbx=1&_udlo&_udhi=20';
$html = new simple_html_dom();
$html->load_file($url);
foreach($html->find('span') as $part){
echo $part;
//when i echo $part it does display many span elements but not the remaining time ones
$cur_class = $part->class;
//the class attribute of an auction item that ends in less than an hour is equal with "MINUTES timeMs alert60Red"
if($cur_class == 'MINUTES timeMs alert60Red'){
echo 'found';
}
}
?>
任何答案都会很有用,在此先感谢
【问题讨论】:
-
回声 $html;正常显示所有元素,如果有什么不明白的地方很抱歉,这是我在这里提出的第一个问题。
标签: php web-crawler simple-html-dom