【发布时间】:2014-03-30 11:57:58
【问题描述】:
我正在尝试使用 python selenium 提取网页中的链接列表。页面上的所有链接在源代码中的格式如下:
<a href = "link"></a>
使用下面的行给我页面上标签名称为a的所有元素:
driver.find_elements_by_tag_name("a")
问题是我只需要一组特定的链接,所有这些链接都在一个表中。上面的代码给了我页面上的所有链接,甚至是表格之外的链接。页面源码的大纲如下:
<html>
...
...
<frame name = "frame">
<a href = "unwantedLink">
<form name = "form">
<table name = "table">
<a href = "link1">
<a href = "link2">
<a href = "link3">
</table>
</form>
</frame>
...
</html>
我需要link1、link2 和link3,但不需要unwantedLink。所需链接和不需要的链接都在同一个帧中,因此无法切换帧。有没有办法在表格中而不是在父框架中查找标签名称a?
谢谢
【问题讨论】: