【发布时间】:2015-10-02 03:25:10
【问题描述】:
有没有什么方法可以有效地将 Selenium 集成到 Scrapy 中以实现其页面渲染功能(以生成屏幕截图)?
我见过的很多解决方案只是在 WebDriver Scrapy 已经处理了请求之后抛出一个 Scrapy 请求/响应 URL,然后就可以解决这个问题。这会创建两倍的请求,在很多方面都失败(需要登录的站点、具有动态或伪随机内容的站点等),并使许多扩展/中间件无效。
有没有什么“好”的方法可以让两者一起工作?有没有更好的方法来生成我正在抓取的内容的屏幕截图?
【问题讨论】:
标签: python selenium selenium-webdriver web-scraping scrapy