【发布时间】:2017-12-14 15:56:43
【问题描述】:
我得到以下代码:
<?php
include('simple_html_dom.php');
$html = file_get_html('http://www.google.com/search?q=BA236',false);
$e = $html->find("div[class=g]");
echo $e[0]->innertext;
?>
当我运行它时,我会得到第一类 google 搜索结果,即:
British Airways Flight 236
Scheduled departs in 13 hours 13 mins
Departure DME 5:40 AM —
Moscow Dec 15
Arrival LHR 6:55 AM Terminal 5
London Dec 15
Scheduled departs in 1 day 13 hours
Departure DME 5:40 AM —
Moscow Dec 16
Arrival LHR 6:55 AM Terminal 5
London Dec 16
我的问题是我不需要所有这些信息,而且我不知道如何过滤此回显,因为 Html 代码没有 id´s 或类。 我想用 jquery 或简单的 css 隐藏我不需要的 html,但是:同样的问题,我没有 id´s 或类来调用它们。
那么我怎样才能过滤掉我不想要的信息。 请给我一个例子,我会检查我需要删除自己的 html。谢谢。
【问题讨论】:
-
你还没有解释你真正想把它减少到什么信息。
-
只是减少一些东西,所以我理解这个过程。谢谢
标签: php html parsing dom screen-scraping