【发布时间】:2008-12-18 02:28:28
【问题描述】:
我无法捕获这些数据:
<tr>
<td><span class="bodytext"><b>Contact:</b><b></b></span><span style='font-size:10.0pt;font-family:Verdana;
mso-bidi-font-family:Arial'><b> </b>
<span class="bodytext">John Doe</span>
</span></td>
</tr>
<tr>
<td><span class="bodytext">PO Box 2112</span></td>
</tr>
<tr>
<td><span class="bodytext"></span></td>
</tr>
<!--*********************************************************
-->
<tr>
<td><span class="bodytext"></span></td>
</tr>
<tr>
<td><span class="bodytext">JOHAN</span> NSW 9700</td>
</tr>
<tr>
<td><strong>Phone:</strong>
02 9999 9999
</td>
</tr>
基本上,我想获取“联系人:”之后和“电话:”之前的所有内容,减去 HTML;但是这两个名称可能并不总是存在,所以我需要真正抓住两个冒号 (:) 之间的所有内容,这些内容不在 HTML 标记内。
<span class="bodytext">***data***</span> 的数量实际上可能会有所不同,所以我需要某种循环来匹配这些。
我更喜欢使用正则表达式,因为我可以可能使用循环和字符串匹配来做到这一点。
另外,我想知道 PHP 正则表达式中不匹配组的语法。
任何帮助将不胜感激!
【问题讨论】: