【发布时间】:2019-07-15 23:12:12
【问题描述】:
我需要捕获一个元素列表:“TEXT TO CAPTURE 1”,“TEXT TO CAPTURE 2”,...用 selenium 和 python 抓取网页。 页面的 HTML 如下:
<div class="contenedor" style="overflow:auto; padding: 6px;">
<div style="width: 75px;">
<p class="line1">
<a href="http://www.somelink1.com/"><img src="https://www.somelink2.com" class="yborder" alt="Name"></a>
</p>
<p class="line1" style="align: center;">
<a href="www.somelink3.com" class="gensmall">TEXT TO CAPTURE 1</a>
</p>
</div>
<div style="width: 75px;">
<p class="line1">
<a href="www.somelink4.com"><img src="hwww.somelink5.com" class="yborder" alt="Dana Vespoli"></a>
</p>
<p class="line1" style="align: center;">
<a href="www.somelink6.com" class="gensmall">TEXT TO CAPTURE 2</a>
</p>
</div>
... others numbers of same <div> fields ....
</div>
元素的数量每天都在变化我打开页面所以元素的数量是不确定的。
我只能得到第一个元素:
driver.find_element_by_xpath("//p[contains(@class, 'line1')]/following::a")
感谢您的帮助
【问题讨论】:
标签: python selenium xpath css-selectors webdriverwait