【问题标题】:Unable to extract page tittle and page_source using IEDriverServer and Selenium through Python无法通过 Python 使用 IEDriverServer 和 Selenium 提取页面标题和页面源
【发布时间】:2020-05-30 22:59:45
【问题描述】:

我刚刚开始硒编码。 我有 python 3.6.6,在 jupyter notebook 上执行以下代码(使用 chrome broser)

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Ie("C:\\Python 36\\IEDriverServer.exe")
driver.get('https://google.com')

print(driver.title)
print(driver.page_source)
driver.close()

这给出了以下输出:

网络驱动程序 WebDriver这是 WebDriver 服务器的初始启动页面。

在此过程中,IE 浏览器打开并转到 google.com(任何所需的站点)但没有关闭

【问题讨论】:

  • 可能是时间问题。页面未完全加载,并且在您尝试获取标题时未设置标题。您可以申请WebDriverWait 等待页面标题呈现。

标签: python selenium internet-explorer webdriverwait selenium-iedriver


【解决方案1】:

要提取页面标题页面来源,您需要:

  • 调用FQDN,即https://www.google.com/get(),即包括www
  • 诱导WebDriverWait 使可点击的WebElement 具有交互性。
  • 结束程序时调用 quit() 而不是 close()
  • 您可以使用以下解决方案:

    from selenium import webdriver
    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support import expected_conditions as EC
    
    driver = webdriver.Ie("C:\\Python 36\\IEDriverServer.exe")
    driver.get('https://www.google.com/')
    WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.NAME, "q")))
    print(driver.title)
    print(driver.page_source)
    driver.quit()
    

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-02-23
    • 2015-09-24
    • 2015-04-05
    • 1970-01-01
    • 2013-10-04
    • 2021-04-20
    • 1970-01-01
    • 2018-06-01
    相关资源
    最近更新 更多