【发布时间】:2015-06-06 11:08:24
【问题描述】:
我正在尝试访问一个表中包含的数据,该表本身包含在一个带有class ='L1' 的表中。
所以基本上我的html结构是这样的:
<table class="L1">
<table>
<tr></tr>
<tr>
<td></td>
<td><a href="">data</a></td>
</tr>
<tr>
<td></td>
<td><a href="">data</a></td>
</tr>
...ect...ect
</table>
</table>
我需要捕获所有<a> </a> 中包含的数据,这些数据包含在<tr> </tr> 中的第二个中,但仅从表的第二个<tr> 开始。
到目前为止,我想出了这个:
html_body = Nokogiri::HTML(body)
links = html_body.css('.L1').xpath("//table/tbody/tr/td[2]/a[1]")
但在我看来,这并没有表达我只想在第二个<tr>(包括第二个<tr>)之后开始的事实?
什么是正确的代码来做到这一点?
【问题讨论】:
标签: ruby web-scraping nokogiri mechanize