【发布时间】:2013-07-06 16:31:58
【问题描述】:
我目前正在处理一个需要使用 XPath 提取一些地址的项目。由于使用normalize-space,下面的 XPath 返回一个节点中所需的所有文本。如果我删除normalize-space,则所需的文本将在 3 个不同的节点中返回,将地址、城市和邮政编码以及国家/地区分开。使用normalize-space 会将所有 3 个节点合并为一个节点,但会弄乱地址的空白,如下所示。
XPath
normalize-space(//table/tr/td[@class='shaded']/table[@cellspacing='10']/tr[2]/td[2])
返回
22-13 20 St., 3nd Fl., FrontStaten Island City, New York 12101United States
期望的输出
22-13 20 St., 3nd Fl., Front, Staten Island City, New York 12101, United States
HTML
<td>
<span class="dispaly">
Address:
</span>
</td>
<td>
22-13 20 St., 3nd Fl., Front
<br>
Staten Island City, New York 12101
<br>
United States
</td>
感谢任何有关如何达到所需输出的建议。
非常感谢!
【问题讨论】:
标签: xpath