【发布时间】:2019-07-05 23:03:00
【问题描述】:
过去 1 年我一直在使用 Selenium 抓取推文,但它无法将页面滚动到一个点之外并指向“返回顶部”。 如何使用 Selenium 解决这个问题?
这是我的代码-
driver=webdriver.Firefox(executable_path="/home/piyush/geckodriver")
url="https://twitter.com/narendramodi"
driver.get(url)
time.sleep(6)
lastHeight = driver.execute_script("return document.body.scrollHeight")
while True:
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
time.sleep(6)
newHeight = driver.execute_script("return document.body.scrollHeight")
if newHeight == lastHeight:
break
lastHeight = newHeight
这是作为图像的输出
【问题讨论】:
-
我没有看到任何与报废相关的代码...
-
@DebanjanB 我没有附加抓取代码,因为我想摆脱这个“回到顶部”的问题。我可以抓取数据,但问题是页面在此之后不再滚动。
-
这违反了 Twitter 服务条款。不允许刮擦。
-
@AndyPiper 但我现在可以使用 twitter 高级搜索选项抓取用户的所有推文。
标签: python selenium twitter web-scraping beautifulsoup