【发布时间】:2021-03-18 22:56:41
【问题描述】:
我(通常)成功地使用这个 python 程序进行网页抓取。 它不仅给了我页面的源代码,还给了我隐藏在 Javascript 后面的代码。 但是,它在此特定网站上无法正常工作。信息丢失。 这似乎不是时间问题。
from selenium import webdriver
url = "https://www.youbet.dk/sport/fodbold/"
options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
driver = webdriver.Chrome(executable_path='D:/Programme/chromedriver_win32/chromedriver.exe',options=options)
driver.get(url)
执行后,driver.page_source 包含代码。
我对按钮上的文字(团队名称和号码)感兴趣。 右键单击并检查 Chrome 中的按钮会给我类似于以下代码的内容,其中包含我正在寻找的信息(此处为“Villarreal”和“1.51”):
<button class="rj-ev-list__bet-btn rj-ev-list__selection-0ML54283820_1" data-uat="button-ev-list-bet-btn"><div class="rj-ev-list__bet-btn__inner " data-uat="div-ev-list-bet-btn-inner"><div class="rj-ev-list__bet-btn__row" data-uat="div-ev-list-bet-btn-row"><span class="rj-ev-list__bet-btn__content rj-ev-list__bet-btn__text" data-uat="ev-list-ev-list-bet-btn-text">Villarreal</span></div><div class="rj-ev-list__bet-btn__row" data-uat="div-ev-list-bet-btn-row"><span class="rj-ev-list__bet-btn__content rj-ev-list__bet-btn__odd" data-uat="ev-list-ev-list-bet-btn-odd">1.51</span></div></div><span class="rj-ev-list__bet-btn__arrow-up"></span><span class="rj-ev-list__bet-btn__arrow-down"></span></button>
但这并没有显示在 driver.page_source 中。
如何使用 python 和 selenium 访问这些信息?
这些没有帮助:
* Adding time.sleep(10)
* Adding driver.implicitly_wait(10)
【问题讨论】:
标签: python-3.x selenium selenium-webdriver web-scraping