【发布时间】:2018-10-03 22:30:18
【问题描述】:
我正在尝试从 URL 获取数据,并且仅从具有 title="" 的范围内检索数据 每个“行”数据都有一个跨度,标题的增量值不同,例如
title="1", title="2"
所以我想要获取的数据将在这个范围内 数据在这里 x 将是一个递增的数字
我可以使用此代码从页面中获取所有数据,但是我被困在如何实现我需要的东西上
function file_get_contents_curl($url)
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
$html = file_get_contents_curl("http://www.example.com");
//parsing all content:
$doc = new DOMDocument();
@$doc->loadHTML($html);
echo "$html";
数据格式如下:
<span id="RANDOMINFO">
<a href="/DEMO/RANDOMDATA">+</a>
<span title="1">DATA I WANT HERE</span>
<a href="https://URL.COM/RANDOM">CLICK</a>
<a href="https://URL.COM/RANDOM">RANDOM DATA</a>
</span>
<span id="RANDOMINFO">
<a href="/DEMO/RANDOMDATA">+</a>
<span title="2">DATA I WANT HERE</span>
<a href="https://URL.COM/RANDOM">CLICK</a>
<a href="https://URL.COM/RANDOM">RANDOM DATA</a>
</span>
【问题讨论】:
-
请添加来自 url 的响应。您应该能够使用 domdoc 或 xpath 获得所需的内容。
-
已添加响应
-
是的,我看到了,但我仍然完全困惑并且不明智