【发布时间】:2011-07-20 21:46:10
【问题描述】:
我正在尝试提取 td 名称和 span 类。 在示例代码中,我想提取第一个 td“附件”中的 a href 和第二个 td 中的 span 标签。
我想打印 鼠标,存在,是的 键盘,没有 双显示器,存在,是的
当我使用下面的 Java 代码时,我得到, 鼠标 是 键盘编号 双显示器是的。
如何获取 span 类名?
HTML 代码
<tr>
<td class="" width="1%" style="padding:0px;">
</td>
<td class="">
<a href="/accessory">Mouse</a>
</td>
<td class="tright ">
<span class='is_present'>Yes</span><br/>
</td>
<td class="tright ">
<br/>
</td>
<tr>
<td class="" width="1%" style="padding:0px;">
</td>
<td class="">
<a href="/accessory"> KeyBoard</a>
</td>
<td colspan="2" class="" style='text-align:center;'>
<small>No</small>
</td>
<td class="" width="1%" style="padding:0px;">
</td>
<td class="">
<a href="/accessory">Dual-Monitor</a>
</td>
<td class="tright ">
<span class='is_present'>Yes</span><br/>
</td>
<td class="tright ">
<br/>
</td>
Java 代码
private void printParse(String HTMLdata){
Element table = data.select("table[class="computer_table").first();
Iterator<Element> ite = table.select("td").iterator();
while(ite.hasnext()){
sysout(ite.next().text());
}
}
【问题讨论】:
标签: java html html-parsing jsoup