无法通过 Python 使用 IEDriverServer 和 Selenium 提取页面标题和页面源

【问题标题】：Unable to extract page tittle and page_source using IEDriverServer and Selenium through Python无法通过 Python 使用 IEDriverServer 和 Selenium 提取页面标题和页面源
【发布时间】：2020-05-30 22:59:45
【问题描述】：

我刚刚开始硒编码。我有 python 3.6.6，在 jupyter notebook 上执行以下代码（使用 chrome broser）

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Ie("C:\\Python 36\\IEDriverServer.exe")
driver.get('https://google.com')

print(driver.title)
print(driver.page_source)
driver.close()

这给出了以下输出：

网络驱动程序 WebDriver这是 WebDriver 服务器的初始启动页面。

在此过程中，IE 浏览器打开并转到 google.com（任何所需的站点）但没有关闭

【问题讨论】：

可能是时间问题。页面未完全加载，并且在您尝试获取标题时未设置标题。您可以申请WebDriverWait 等待页面标题呈现。

标签： python selenium internet-explorer webdriverwait selenium-iedriver

【解决方案1】：

要提取页面标题和页面来源，您需要：

调用FQDN，即https://www.google.com/ 到get()，即包括www。
诱导WebDriverWait 使可点击的WebElement 具有交互性。
结束程序时调用 quit() 而不是 close()。

您可以使用以下解决方案：

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Ie("C:\\Python 36\\IEDriverServer.exe")
driver.get('https://www.google.com/')
WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.NAME, "q")))
print(driver.title)
print(driver.page_source)
driver.quit()

【讨论】：