【发布时间】:2014-01-31 12:14:59
【问题描述】:
我正在尝试使用内置搜索功能中的网站从中收集数据,但无法弄清楚如何按下“搜索”按钮,因为它周围有一些 javascript,并且 id 会随着每次新的迭代而改变这页纸。
网站部分的数据如下。
<html>
<head>
</head>
<body>
<table>
<tr>
<td>
<td>
<table>
<tr>
<td>
<!-- start of toolbar Main -->
<table>
<tr>
<td>
<table>
<tr class="buttonPad">
</tr>
<tr>
* <td nowrap="true" valign="top" class="button"><a id="S7674" accesskey="S" class="button" title="SEARCH" onclick="dispatch('S7674');"><u>S</u>></td>
</tr>
</table>
</td>
<td</td>
</tr>
</table>
</td>
</tr>
</table>
</td>
</td>
</tr>
</table>
</body>
</html>
还有我的代码
my $tree= HTML::TreeBuilder::XPath->new;
$tree->parse($url);
my @nodes = $tree->findnodes('/html/body/table/tbody/tr/td/table/tbody/tr/td/table/tbody/tr/td/table.buttonSpace/tbosy/tr/a.button')->get_nodelist; # line is modified later.
my $nodecount = scalar(@nodes);
if ($nodecount > 0 ) { print "we found something\n"; }
else { print "nothing found\n"; }
foreach my $node (@nodes)
{
print "node is $node\n";
my $id = $node->findvalue('button');
print "my id is $id\n";
}
遗憾的是,我的代码没有返回任何节点值。
非常感谢。
微型
【问题讨论】:
标签: javascript perl xpath html-treebuilder