【发布时间】:2018-03-11 21:56:46
【问题描述】:
我正在尝试从加载后/加载时由 javascript 修改的网页获取 HTML。我已按照this tutorial 中的说明进行操作。并且在最初加载页面后,我在我的 Python 代码中使用了这样的命令
html = browser.execute_script("return document.body.innerHTML")
虽然这似乎获得了我尝试过的其他页面上的所有 HTML Selenium 元素,但它似乎不适用于 this page。如果您打开该页面并检查 HTML,您可以看到所有 HTML 已加载。我想捕捉下面的元素,但不能。顺便说一句,WebDriverWait 似乎也不起作用......
<b>
<a href="contractor_list.asp?alpha=A">A </a>
<a href="contractor_list.asp?alpha=B">B </a>
<a href="contractor_list.asp?alpha=C">C </a>
<a href="contractor_list.asp?alpha=D">D </a>
...
如何让 Selenium 向我公开这些元素,以便我可以访问它们?或者,我应该为此使用其他工具吗?
【问题讨论】:
-
感谢与此相关的其他 SO 问题的链接。在发帖之前我试图找到一个相关的问题,但当时不知道我应该使用“iframe”作为我的搜索关键字之一。
标签: javascript python html selenium web-scraping