【发布时间】:2014-05-05 10:52:56
【问题描述】:
我想从给定表格的特定行中提取文本,例如:
<table>
<th> head1 </th>
<th> head2 </th>
<tr> <td> cell1 </td> <td> cell2 </td> </tr>
<tr> <td> cell3 </td> <td> cell4 </td> </tr>
</table>
通过在 Java 中使用 Jsoup,如何仅提取该表中第 1 行的内容。所需的输出如下:
cell1, cell2
我尝试了以下代码,但它打印了我不喜欢的标题行:
Element table = doc.getElementsByTag("table").first();
Elements trs = table.getElementsByTag("tr");
for (Element tr : trs) {
for (Element td : tr.getAllElements()) {
System.out.println("TD: " + td.text());
....
【问题讨论】:
标签: java web-scraping html-table jsoup row