使用 selenium 从页面中提取链接答案

【问题标题】：extract links from a page using selenium使用 selenium 从页面中提取链接
【发布时间】：2020-06-04 08:15:44
【问题描述】：

我是硒新手，我正在研究如何使用硒提取我想要的东西

我想提取网页中的超链接，但只提取具有特定标签的超链接。超链接全部嵌套在以下结构中：

<a title="Chris Frye" class="_32mo" href="https://www.facebook.com/CnMFrye"><span>Chris Frye</span></a>

但是，当使用标签“a”时，我意识到它会抓取其他超链接，所以我认为我需要同时设置标签“a”和“class”。

在这种情况下，正确的策略是什么？我似乎无法使用driver.find_elements_by_tag_name，因为这仅适用于单个标签。

【问题讨论】：

【解决方案1】：

您可以像下面这样使用 css 选择器：

elements = driver.find_elements_by_css_selector('a._32mo')

或者使用xpath：

elements = driver.find_elements_by_xpath("//a[@class='_32mo']")

【讨论】：