【问题标题】:Python Selenium - Source from href linkPython Selenium - 来自 href 链接的来源
【发布时间】:2021-06-30 22:58:44
【问题描述】:

我希望能够获得我从 a href 获得的链接的源页面,而无需更改 Selenium 页面。

我正在使用

获取 a 元素
driver.find_element(By.XPATH, "//a[contains(@class, 'css-1xyedec e1pf1lj70')]")

然后我可以使用在 href 中获取链接

elem.get_attribute('href')

但我找不到在不更改浏览器页面的情况下使用 selenium 获取链接源页面的方法。

编辑:Here 是我正在尝试做的网站。 位于每个销售中的每个 div 中,包括照片和带有标题、价格的部分...

【问题讨论】:

  • 您可以使用该链接打开一个新选项卡,然后使用 driver.page_source 将其关闭。
  • 这个类似乎是动态的:e1pf1lj70。请添加 html 代码。
  • @ArundeepChohan 如果没有更好的解决方案,我可能会这样做。
  • @vitaliis 我刚刚更新了问题。
  • 在获得页面的 href 后,如果不是动态的,请尝试使用 requests 库获取 HTML html = requests.get(url)

标签: python selenium


【解决方案1】:

检查此答案 https://sqa.stackexchange.com/questions/17022/how-to-fill-captcha-using-test-automation 。 您无法自动化验证码。您应该向开发团队寻求解决方法。 我会要求在测试环境中禁用 CAPTCHA。把它放在那里是没有意义的。

【讨论】:

  • 我确实设法使用 selenium 绕过验证码,并将 cookie 从一个会话保存到另一个会话。它工作得很好,但限制了我的工作,因为例如我不能对请求做同样的事情。我不能问开发团队,我不是为他们工作,我正在尝试从销售中收集数据。
  • 好的,祝你找到答案。如果您自己找到,请发布。
猜你喜欢
  • 2012-05-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-10-20
  • 1970-01-01
  • 1970-01-01
  • 2021-12-20
相关资源
最近更新 更多