【发布时间】:2020-12-18 11:48:42
【问题描述】:
好的,我卡住了。我使用 selenium 和 PhantomJS 制作了一个小的网络抓取 python 脚本。我正在处理的页面在我的网络驱动程序未运行的 iframe 文档中包含我想要的数据。
<main Page Heads etc>
<blah>
<iframe 1 src="src1" ... etc etc>
#document
<tag>
<tag>
<iframe2 src="src2"><iframe2>
<iframe1>
<blah>
<end of webpage DOM>
我想得到iframe2 的src。我试图通过我的网络驱动程序运行src1 URL,但我得到的只是原始页面 html,而不是加载的网页元素,iframe2 必须由iframe1 中的某些脚本创建,但我无法获得我的webdriver 来运行脚本。
有什么想法吗?
这就是我在网页上运行 javascript 以获取已编译的页面 DOM:
from selenium import webdriver
self.driver = webdriver.PhantomJS()
self.driver.get(url)
page = self.driver.page_source
soup = BeautifulSoup(page,'html.parser')
【问题讨论】:
标签: python selenium iframe phantomjs