【发布时间】:2016-02-17 15:46:35
【问题描述】:
我正在尝试使用 PHP 抓取一个表格,问题是我已经设法抓取它,但是我在网页的表格上得到了 everything。我不确定如何指定要抓取的 TD 和/或 TR。
这是 PHP 代码
<?php
include("simple_html_dom.php");
$html=file_get_html("http://www.premierleague.com/en-gb/matchday/league-table.html");
$html=new simple_html_dom($html);
foreach($html->find('table tr') as $row) {
$cell = $row->find('td', 0);
echo $row;
}
?>
我想要得到的(如果你查看the website)是: 俱乐部名称、出场、赢球、输球、进球数、失球数、净胜球数和积分。
我得到的是表格中的所有内容,包括折叠的团队信息。它看起来像这样(不确定图片是否是发布它的最佳方式,但我不确定如何以另一种方式显示它,我突出显示了我真正想要刮掉的部分):
【问题讨论】:
-
是否有与表格行关联的特定 ID?
-
是的,但是它们每个都有不同的名称,我想要的
类被命名为:club-row1,2,3,4,5,6 等,而 类被命名: col-club,col-p,col-d 等。如果这就是你的意思。
标签: php html html-table simple-html-dom scrape