【发布时间】:2019-03-06 16:09:46
【问题描述】:
我创建了一个脚本,输入登录名和密码,按下登录按钮,进入搜索页面,输入搜索并获取结果页面。 我需要存储这个结果 URL,这样我就可以使用 Beautiful soup 来提取我需要的信息。但是,我无法使用 requests 库,因为在进行搜索之前我不知道 URL。 下面是我的问题的一个例子,我点击提交按钮很好,页面加载延迟 2 秒。然后我尝试将结果页面存储为变量 r 并使用汤来获取我需要的信息。
但是使用下面的代码,我得到错误'str' object has no attribute 'content',所以我认为这是我的 r 变量。提前致谢。
submitbutton.click()
time.sleep(2)
r = browser.page_source
soup = bs4.BeautifulSoup(r.content,'lxml')
data = soup.find("div" , {"class": "specification"})
【问题讨论】:
-
只使用
r而不是r.content
标签: python selenium beautifulsoup