【问题标题】:extract links from a page using selenium使用 selenium 从页面中提取链接
【发布时间】:2020-06-04 08:15:44
【问题描述】:

我是硒新手,我正在研究如何使用硒提取我想要的东西

我想提取网页中的超链接,但只提取具有特定标签的超链接。超链接全部嵌套在以下结构中:

<a title="Chris Frye" class="_32mo" href="https://www.facebook.com/CnMFrye"><span>Chris Frye</span></a>

但是,当使用标签“a”时,我意识到它会抓取其他超链接,所以我认为我需要同时设置标签“a”和“class”。

在这种情况下,正确的策略是什么?我似乎无法使用driver.find_elements_by_tag_name,因为这仅适用于单个标签。

我要抓取的页面是:https://www.facebook.com/public/chris-frye

【问题讨论】:

    标签: python-3.x selenium web-scraping webdriver


    【解决方案1】:

    您可以像下面这样使用 css 选择器:

    elements = driver.find_elements_by_css_selector('a._32mo')
    

    或者使用xpath:

    elements = driver.find_elements_by_xpath("//a[@class='_32mo']")
    

    【讨论】:

    • 非常感谢!
    • @song0089 如果解决了问题,请随时接受或/和投票赞成这个答案:)
    猜你喜欢
    • 2020-09-21
    • 1970-01-01
    • 1970-01-01
    • 2011-10-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-06-04
    • 1970-01-01
    相关资源
    最近更新 更多