【问题标题】:How to extract info within a #shadow-root (open) using Selenium Python?如何使用 Selenium Python 在#shadow-root(打开)中提取信息?
【发布时间】:2021-03-10 16:20:45
【问题描述】:

我得到了与在线商店https://www.tiendasjumbo.co/buscar?q=mani 相关的下一个网址,但我无法将产品标签提取到另一个字段:

from selenium import webdriver
import time
from random import randint

driver = webdriver.Firefox(executable_path= "C:\Program Files (x86)\geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)

url =  "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')

我做错了什么,我也尝试切换 iframe 但没有办法实现我的目标?欢迎任何帮助。

【问题讨论】:

  • 似乎有什么问题?
  • 向我们展示您想从该网站获得什么。

标签: python selenium selenium-webdriver shadow-dom queryselector


【解决方案1】:

https://www.tiendasjumbo.co/buscar?q=mani 网站内的产品位于 #shadow-root (open) 内。


解决方案

要提取产品标签,您必须使用shadowRoot.querySelector(),您可以使用以下Locator Strategy

  • 代码块:

    driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
    item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
    print(item.text)
    
  • 控制台输出:

    La especial mezcla de nueces, maní, almendras y marañones x 450 g
    

参考文献

您可以在以下位置找到一些相关讨论:

【讨论】:

  • @AlexisAG 很高兴能为您提供帮助。 Upvote 答案如果这个/任何答案对您/对您有帮助,以造福未来的读者。
猜你喜欢
  • 2021-04-03
  • 2017-03-22
  • 2021-05-18
  • 2020-06-01
  • 1970-01-01
  • 2020-11-01
  • 2021-12-21
  • 2022-01-08
  • 2019-01-08
相关资源
最近更新 更多