【发布时间】:2012-05-09 07:21:33
【问题描述】:
如何在 PHP 中从 HTML 表中提取数据。数据就是这种格式
表 1
<tr><td class="body" valign="top"><a href="example"><b>DATA</b></a></td><td class="body" valign="top">Data_Text</td></tr>
表 2
<tr><th><div id="Data">Data</div></th><td>Data_Text_1</td><td>Data_Text_2</td></tr>
表 3
<tr><td width="120"><a href="example" target="_blank">DATA</a></td><td>Data_Text</td></tr>
我想从 3 个表格 中获取 Data 和 Data_Text 或 (Data_Text_1 & Data_Text_2)。
我用过
$html = file_get_contents($link);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$nodes = $xpath->query('//td[]');
$nodes2 = $xpath->query('//td[]');
但它不能显示任何数据!
我会在后天悬赏这个问题
【问题讨论】:
-
似乎有一些错误:您无法从表 2 中获取
"Data_Text"-- 它没有具有此类字符串值的文本节点。请编辑并更正。