【发布时间】:2016-05-30 23:16:29
【问题描述】:
我需要使用 php 解析 html 表。但是在第一条记录之后,最后几条记录没有开始<tr>标签。下面是代码:
<tr class="odd">
<td class="dragHandle"></td>
<td class="checkbox"></td>
<td>4228651391</td>
<td>Payment</td>
<td>01850147130</td>
<td>01670808080</td>
<td>10</td>
<td>lcghs786</td>
<td>1</td>
<td>18-feb-16 21:37:52</td>
</tr>
<td class="dragHandle"></td>
<td class="checkbox"></td>
<td>4226429613</td>
<td>Payment</td>
<td>01957814120</td>
<td>01670808080</td>
<td>5</td>
<td>aims777</td>
<td>1</td>
<td>18-feb-16 17:44:12</td>
</tr>
<td class="dragHandle"></td>
<td class="checkbox"></td>
<td>4226292073</td>
<td>Payment</td>
<td>01957814120</td>
<td>01670808080</td>
<td>10</td>
<td>AIMS786</td>
<td>1</td>
<td>18-feb-16 17:28:02</td>
</tr>
我尝试使用 simple_html_dom 库,但它只返回 array 作为第一条记录。请帮助我如何解析所有记录并输入array。
谢谢
【问题讨论】:
-
如果您尝试解析损坏的 HTML,您将遇到麻烦... :|
-
在尝试解析 HTML 之前,是否有 任何 方法使 HTML 有效?你在哪里得到无效的 HTML?如果 DOM 解析器因为无效而无法理解它,那么您可能需要手动解析字符串。也许将其分解为
'</tr>'上的字符串数组并尝试单独解析每个段?