【发布时间】:2012-02-08 22:53:46
【问题描述】:
我有一个类似于此的表的 NodeSet:
<table cellpadding="1" cellspacing="0" width="100%" border="0">
<tr>
<td colspan="9" class="csoGreen"><b class="white">Bill Statement Detail</b></td>
</tr>
<tr>
<td><b>Bill Date</b></td>
<td"><b>Bill Amount</b></td>
<td"><b>Bill Due Date</b></td>
<td"><b>Bill (PDF)</b></td>
</tr>
<tr vAlign="top">
<td>blahA</td>
<td>blahB</td>
<td>blahC</td>
<td><a href="javascript: void(0);" onclick="javascript:window.open('/cso/displaypdfbill?selectedBillkey=447403730','_blank');">View Bill</a></td>
</tr>
现在我计划循环遍历表格中的每个 onclick。
我一直在尝试遍历 NodeSet,但没有成功。
我以许多失败的尝试告终,但我想它最终会看起来像这样:
doc_list.each_element ("//a[td/text()='onclick']/@href") do | |
#here I want to scan and save BlahA into a Variable
end
【问题讨论】:
-
您到底想从 HTML 中提取什么?
-
我要提取数据 blahA