【发布时间】:2017-09-12 14:21:09
【问题描述】:
在 curl 请求中,我有一个具有以下结构的 html 表。我现在只想提取包含空类的 span 元素的表行,而不是 class="subcomponent" 的表行。
我成功地尝试了 Xpath 来查找具有空类的元素,但是如何获得包含 Version 和 Partnumber 的整个 <tr> 甚至更好的特定 <td> 节点。
提前致谢。
<table>
...
<tbody>
<tr>
<td></td>
<td></td>
<td>
<span class="">Product</span>
</td>
<td>Version</td>
<td>Partnumber</td>
</tr>
<tr>
<td></td>
<td></td>
<td>
<span class="subcomponent">Component</span>
</td>
<td>Version</td>
<td>Partnumber</td>
</tr>
</tbody>
我的 PHP 代码
$doc = new DOMdocument();
libxml_use_internal_errors(true);
$doc->loadHTML($page);
$doc->saveHTML();
$xpath = new DOMXpath($doc);
$query ='//span[@class=""]';
$entries = $xpath->query($query);
foreach ($entries as $entry) {
echo $entry->C14N();
}
【问题讨论】: